web_nlg

Deskripsi :

Data berisi kumpulan 1 hingga 7 rangkap tiga bentuk subjek-predikat-objek yang diekstrak dari (DBpedia)[ https://wiki.dbpedia.org/ ] dan teks bahasa alami yang merupakan verbalisasi dari rangkap tiga ini. Data pengujian mencakup 15 domain berbeda di mana hanya 10 yang muncul di data pelatihan. Dataset mengikuti format tabel standar.

Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://webnlg-challenge.loria.fr/challenge_2017/
Kode sumber : tfds.structured.web_nlg.WebNlg
Versi :
- 0.1.0 (default): Tidak ada catatan rilis.
Ukuran unduhan : 19.76 MiB
Ukuran dataset : 13.78 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :

Membelah	Contoh
`'test_all'`	4.928
`'test_unseen'`	2.433
`'train'`	18.102
`'validation'`	2.268

Struktur fitur :

FeaturesDict({
    'input_text': FeaturesDict({
        'context': string,
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})

Dokumentasi fitur :

Fitur	Kelas	Dtype
	fiturDict
Masukkan teks	fiturDict
masukan_teks/konteks	Tensor	rangkaian
masukan_teks/tabel	Urutan
input_text/table/column_header	Tensor	rangkaian
input_teks/tabel/konten	Tensor	rangkaian
input_teks/tabel/nomor_baris	Tensor	int16
target_text	Tensor	rangkaian

Kunci yang diawasi (Lihat as_supervised doc ): ('input_text', 'target_text')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):

Kutipan :

@inproceedings{gardent2017creating,
    title = ""Creating Training Corpora for {NLG} Micro-Planners"",
    author = ""Gardent, Claire  and
      Shimorina, Anastasia  and
      Narayan, Shashi  and
      Perez-Beltrachini, Laura"",
    booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
    month = jul,
    year = ""2017"",
    address = ""Vancouver, Canada"",
    publisher = ""Association for Computational Linguistics"",
    doi = ""10.18653/v1/P17-1017"",
    pages = ""179--188"",
    url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}