x toplam

  • Açıklama :

Aşırı Özetleme (XSum) Veri Kümesi.

İki özellik vardır: - belge: Haber makalesi girin. - özet: Makalenin bir cümlelik özeti.

Bu verilerin https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md'de açıklandığı gibi manuel olarak indirilmesi ve çıkarılması gerekir. 'xsum-extracts-from-downloads' klasörü şu şekilde sıkıştırılmalıdır: 'xsum-extracts-from-downloads.tar.gz' ve manuel olarak indirilen klasöre koyun.

Bölmek örnekler
'test' 11.301
'train' 203.577
'validation' 11.305
  • Özellik yapısı :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
belge Metin sicim
özet Metin sicim
  • Alıntı :
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}