- Deskripsi :
Data berisi kumpulan 1 hingga 7 tripel bentuk subjek-predikat-objek yang diekstrak dari (DBpedia) [ https://wiki.dbpedia.org/ ] dan teks bahasa alami yang merupakan verbalisasi dari tripel ini. Data pengujian mencakup 15 domain berbeda di mana hanya 10 yang muncul dalam data pelatihan. Dataset mengikuti format tabel standar.
Situs web : https://webnlg-challenge.loria.fr/challenge_2017/
Kode sumber :
tfds.structured.web_nlg.WebNlg
Versi :
-
0.1.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
19.76 MiB
Ukuran
13.78 MiB
data :13.78 MiB
Cache otomatis ( dokumentasi ): Ya
Split :
Membagi | Contoh |
---|---|
'test_all' | 4.928 |
'test_unseen' | 2.433 |
'train' | 18.102 |
'validation' | 2.268 |
- Fitur :
FeaturesDict({
'input_text': FeaturesDict({
'context': tf.string,
'table': Sequence({
'column_header': tf.string,
'content': tf.string,
'row_number': tf.int16,
}),
}),
'target_text': tf.string,
})
Kunci yang diawasi (Lihat dokumen
as_supervised
):('input_text', 'target_text')
Kutipan :
@inproceedings{gardent2017creating,
title = ""Creating Training Corpora for {NLG} Micro-Planners"",
author = ""Gardent, Claire and
Shimorina, Anastasia and
Narayan, Shashi and
Perez-Beltrachini, Laura"",
booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
month = jul,
year = ""2017"",
address = ""Vancouver, Canada"",
publisher = ""Association for Computational Linguistics"",
doi = ""10.18653/v1/P17-1017"",
pages = ""179--188"",
url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):