- תיאור :
הנתונים מכילים קבוצות של 1 עד 7 שלשות מהצורה נושא-פרדיקאט-אובייקט המופק מ-(DBpedia)[ https://wiki.dbpedia.org/ ] וטקסט בשפה טבעית המהווה מילולית של השלשות הללו. נתוני הבדיקה משתרעים על פני 15 תחומים שונים כאשר רק 10 מופיעים בנתוני ההדרכה. מערך הנתונים עוקב אחר פורמט טבלה סטנדרטי.
תיעוד נוסף : חקור על ניירות עם קוד
קוד מקור :
tfds.structured.web_nlg.WebNlg
גרסאות :
-
0.1.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
19.76 MiB
גודל ערכת נתונים:
13.78 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test_all' | 4,928 |
'test_unseen' | 2,433 |
'train' | 18,102 |
'validation' | 2,268 |
- מבנה תכונה :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
הקלד טקסט | FeaturesDict | |||
input_text/הקשר | מוֹתֵחַ | חוּט | ||
input_text/טבלה | סדר פעולות | |||
input_text/table/column_header | מוֹתֵחַ | חוּט | ||
input_text/טבלה/תוכן | מוֹתֵחַ | חוּט | ||
input_text/table/row_number | מוֹתֵחַ | int16 | ||
target_text | מוֹתֵחַ | חוּט |
מפתחות בפיקוח (ראה
as_supervised
):('input_text', 'target_text')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@inproceedings{gardent2017creating,
title = ""Creating Training Corpora for {NLG} Micro-Planners"",
author = ""Gardent, Claire and
Shimorina, Anastasia and
Narayan, Shashi and
Perez-Beltrachini, Laura"",
booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
month = jul,
year = ""2017"",
address = ""Vancouver, Canada"",
publisher = ""Association for Computational Linguistics"",
doi = ""10.18653/v1/P17-1017"",
pages = ""179--188"",
url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}