- תיאור:
נתון מכילים סטים של 1 עד 7 שלשות של הנושא-הנשוא-אובייקט הטופס שחולץ מן (DBpedia) [ https://wiki.dbpedia.org/ ] וטקסט בשפה טבעי שזה verbalisation של משולשים אלה. נתוני הבדיקה משתרעים על 15 תחומים שונים בהם רק 10 מופיעים בנתוני האימון. מערך הנתונים בפורמט טבלה סטנדרטי.
קוד מקור:
tfds.structured.web_nlg.WebNlg
גרסאות:
-
0.1.0
(ברירת המחדל): הערות השחרור לא.
-
גודל ההורדה:
19.76 MiB
מערך נתונים גודל:
13.78 MiB
Auto-במטמון ( תיעוד ): כן
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'test_all' | 4,928 |
'test_unseen' | 2,433 |
'train' | 18,102 |
'validation' | 2,268 |
- מאפיינים:
FeaturesDict({
'input_text': FeaturesDict({
'context': tf.string,
'table': Sequence({
'column_header': tf.string,
'content': tf.string,
'row_number': tf.int16,
}),
}),
'target_text': tf.string,
})
מפתחות השגחה (ראה
as_supervised
doc ):('input_text', 'target_text')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט:
@inproceedings{gardent2017creating,
title = ""Creating Training Corpora for {NLG} Micro-Planners"",
author = ""Gardent, Claire and
Shimorina, Anastasia and
Narayan, Shashi and
Perez-Beltrachini, Laura"",
booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
month = jul,
year = ""2017"",
address = ""Vancouver, Canada"",
publisher = ""Association for Computational Linguistics"",
doi = ""10.18653/v1/P17-1017"",
pages = ""179--188"",
url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}