Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

xsum

  • Deskripsi :

Kumpulan Data Extreme Summarization (XSum).

Ada dua fitur: - dokumen: Memasukkan artikel berita. - ringkasan: Satu kalimat ringkasan artikel.

Data ini perlu diunduh dan diekstrak secara manual seperti yang dijelaskan di https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md Folder 'xsum-extracts-from-downloads' perlu dikompresi sebagai 'xsum-extracts-from-downloads.tar.gz' dan masukkan ke folder yang diunduh secara manual.

Membagi Contoh
'test' 11.301
'train' 203.577
'validation' 11.305
  • Fitur :
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}