لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

web_nlg

  • الوصف :

تحتوي البيانات على مجموعات من 1 إلى 7 ثلاثيات من نموذج الموضوع - المسند - الكائن المستخرج من (DBpedia) [ https://wiki.dbpedia.org/ ] ونص اللغة الطبيعية الذي يمثل شرحًا لفظيًا لهذه الثلاثيات. تمتد بيانات الاختبار إلى 15 مجالًا مختلفًا حيث يظهر 10 فقط في بيانات التدريب. تتبع مجموعة البيانات تنسيق جدول قياسي.

انشق، مزق أمثلة
'test_all' 4،928
'test_unseen' 2433
'train' 18102
'validation' 2،268
  • الميزات :
FeaturesDict({
    'input_text': FeaturesDict({
        'context': tf.string,
        'table': Sequence({
            'column_header': tf.string,
            'content': tf.string,
            'row_number': tf.int16,
        }),
    }),
    'target_text': tf.string,
})
  • الاقتباس :
@inproceedings{gardent2017creating,
    title = ""Creating Training Corpora for {NLG} Micro-Planners"",
    author = ""Gardent, Claire  and
      Shimorina, Anastasia  and
      Narayan, Shashi  and
      Perez-Beltrachini, Laura"",
    booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
    month = jul,
    year = ""2017"",
    address = ""Vancouver, Canada"",
    publisher = ""Association for Computational Linguistics"",
    doi = ""10.18653/v1/P17-1017"",
    pages = ""179--188"",
    url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}