- Deskripsi :
Multi-News, terdiri dari artikel berita dan ringkasan tulisan manusia dari artikel ini dari situs newser.com. Setiap ringkasan ditulis secara profesional oleh editor dan menyertakan tautan ke artikel asli yang dikutip.
Ada dua fitur: - dokumen: teks artikel berita yang dipisahkan dengan tanda khusus "||i>i> E5E5E5". - ringkasan: ringkasan berita.
Situs web : https://github.com/Alex-Fabbri/Multi-News
Kode sumber :
tfds.summarization.MultiNews
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
245.06 MiB
Ukuran kumpulan data :
Unknown size
Cache otomatis ( dokumentasi ): Tidak diketahui
Split :
Membagi | Contoh |
---|---|
'test' | 5.622 |
'train' | 44.972 |
'validation' | 5.622 |
- Fitur :
FeaturesDict({
'document': Text(shape=(), dtype=tf.string),
'summary': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('document', 'summary')
Kutipan :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):