web_nlg

  • תיאור :

הנתונים מכילים קבוצות של 1 עד 7 שלשות מהצורה נושא-פרדיקאט-אובייקט המופק מ-(DBpedia)[ https://wiki.dbpedia.org/ ] וטקסט בשפה טבעית המהווה מילולית של השלשות הללו. נתוני הבדיקה משתרעים על פני 15 תחומים שונים כאשר רק 10 מופיעים בנתוני ההדרכה. מערך הנתונים עוקב אחר פורמט טבלה סטנדרטי.

לְפַצֵל דוגמאות
'test_all' 4,928
'test_unseen' 2,433
'train' 18,102
'validation' 2,268
  • מבנה תכונה :
FeaturesDict({
    'input_text': FeaturesDict({
        'context': string,
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
הקלד טקסט FeaturesDict
input_text/הקשר מוֹתֵחַ חוּט
input_text/טבלה סדר פעולות
input_text/table/column_header מוֹתֵחַ חוּט
input_text/טבלה/תוכן מוֹתֵחַ חוּט
input_text/table/row_number מוֹתֵחַ int16
target_text מוֹתֵחַ חוּט
  • ציטוט :
@inproceedings{gardent2017creating,
    title = ""Creating Training Corpora for {NLG} Micro-Planners"",
    author = ""Gardent, Claire  and
      Shimorina, Anastasia  and
      Narayan, Shashi  and
      Perez-Beltrachini, Laura"",
    booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
    month = jul,
    year = ""2017"",
    address = ""Vancouver, Canada"",
    publisher = ""Association for Computational Linguistics"",
    doi = ""10.18653/v1/P17-1017"",
    pages = ""179--188"",
    url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}