Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

wiki_table_text

  • Deskripsi :

Tabel Wikipedia dengan setidaknya 3 baris dan 2 kolom, 3 baris acak untuk setiap tabel dipilih untuk penjelasan lebih lanjut. Setiap baris diberi anotasi oleh orang yang berbeda, sehingga kumpulan data disusun oleh pasangan (tabel satu baris, deskripsi teks). Anotasi menyertakan setidaknya 2 sel dari baris tersebut, tetapi tidak perlu menyertakan semuanya. Dataset mengikuti format tabel standar.

Membagi Contoh
'test' 2.000
'train' 10.000
'validation' 1.318
  • Fitur :
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': tf.string,
            'content': tf.string,
            'row_number': tf.int16,
        }),
    }),
    'target_text': tf.string,
})
@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}