web_nlg

תיאור :

הנתונים מכילים קבוצות של 1 עד 7 שלשות מהצורה נושא-פרדיקאט-אובייקט המופק מ-(DBpedia)[ https://wiki.dbpedia.org/ ] וטקסט בשפה טבעית המהווה מילולית של השלשות הללו. נתוני הבדיקה משתרעים על פני 15 תחומים שונים כאשר רק 10 מופיעים בנתוני ההדרכה. מערך הנתונים עוקב אחר פורמט טבלה סטנדרטי.

תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://webnlg-challenge.loria.fr/challenge_2017/
קוד מקור : tfds.structured.web_nlg.WebNlg
גרסאות :
- 0.1.0 (ברירת מחדל): אין הערות שחרור.
גודל הורדה : 19.76 MiB
גודל ערכת נתונים: 13.78 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :

לְפַצֵל	דוגמאות
`'test_all'`	4,928
`'test_unseen'`	2,433
`'train'`	18,102
`'validation'`	2,268

מבנה תכונה :

FeaturesDict({
    'input_text': FeaturesDict({
        'context': string,
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})

תיעוד תכונה :

תכונה	מעמד	Dtype
	FeaturesDict
הקלד טקסט	FeaturesDict
input_text/הקשר	מוֹתֵחַ	חוּט
input_text/טבלה	סדר פעולות
input_text/table/column_header	מוֹתֵחַ	חוּט
input_text/טבלה/תוכן	מוֹתֵחַ	חוּט
input_text/table/row_number	מוֹתֵחַ	int16
target_text	מוֹתֵחַ	חוּט

מפתחות בפיקוח (ראה as_supervised ): ('input_text', 'target_text')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):

ציטוט :

@inproceedings{gardent2017creating,
    title = ""Creating Training Corpora for {NLG} Micro-Planners"",
    author = ""Gardent, Claire  and
      Shimorina, Anastasia  and
      Narayan, Shashi  and
      Perez-Beltrachini, Laura"",
    booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
    month = jul,
    year = ""2017"",
    address = ""Vancouver, Canada"",
    publisher = ""Association for Computational Linguistics"",
    doi = ""10.18653/v1/P17-1017"",
    pages = ""179--188"",
    url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}

web_nlg קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

web_nlg