- Açıklama:
Multi-News, newser.com sitesinden haber yazıları ve bu yazıların insan tarafından yazılmış özetlerinden oluşmaktadır. Her özet, editörler tarafından profesyonelce yazılır ve alıntı yapılan orijinal makalelere bağlantılar içerir.
İki özellik vardır: - belge: "|||||" özel işaretiyle ayrılmış haber metni metni. - özet: haber özeti.
Kaynak kodu:
tfds.summarization.MultiNews
sürümleri:
-
1.0.0
(varsayılan): Hayır sürüm notları.
-
İndirme boyutu:
245.06 MiB
Veri kümesi boyutu:
Unknown size
Otomatik önbelleğe ( dokümantasyon ): Bilinmeyen
Splits:
Bölmek | Örnekler |
---|---|
'test' | 5.622 |
'train' | 44.972 |
'validation' | 5.622 |
- Özellikler:
FeaturesDict({
'document': Text(shape=(), dtype=tf.string),
'summary': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('document', 'summary')
Şekil ( tfds.show_examples ): desteklenmez.
Örnekler ( tfds.as_dataframe ):
- Citation:
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}