Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

web_nlg

  • Deskripsi :

Data berisi kumpulan 1 hingga 7 tripel bentuk subjek-predikat-objek yang diekstrak dari (DBpedia) [ https://wiki.dbpedia.org/ ] dan teks bahasa alami yang merupakan verbalisasi dari tripel ini. Data pengujian mencakup 15 domain berbeda di mana hanya 10 yang muncul dalam data pelatihan. Dataset mengikuti format tabel standar.

Membagi Contoh
'test_all' 4.928
'test_unseen' 2.433
'train' 18.102
'validation' 2.268
  • Fitur :
FeaturesDict({
    'input_text': FeaturesDict({
        'context': tf.string,
        'table': Sequence({
            'column_header': tf.string,
            'content': tf.string,
            'row_number': tf.int16,
        }),
    }),
    'target_text': tf.string,
})
@inproceedings{gardent2017creating,
    title = ""Creating Training Corpora for {NLG} Micro-Planners"",
    author = ""Gardent, Claire  and
      Shimorina, Anastasia  and
      Narayan, Shashi  and
      Perez-Beltrachini, Laura"",
    booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
    month = jul,
    year = ""2017"",
    address = ""Vancouver, Canada"",
    publisher = ""Association for Computational Linguistics"",
    doi = ""10.18653/v1/P17-1017"",
    pages = ""179--188"",
    url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}