- Açıklama:
Aşırı Özetleme (XSum) Veri Kümesi.
İki özellik vardır: - belge: Girdi haber makalesi. - özet: Makalenin bir cümlelik özeti.
De tarif edildiği gibi bu veriler ihtiyaç manaully indirilir ve ekstre etmek https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md klasörün xsum-ekstreler-den-indirir 'ihtiyaç olarak sıkıştırılacak 'xsum-extracts-from-downloads.tar.gz' ve manuel olarak indirilen klasöre koyun.
Anasayfa: https://github.com/EdinburghNLP/XSum/tree/master/XSum-Dataset
Kaynak kodu:
tfds.summarization.Xsum
sürümleri:
-
1.0.0
: temizleme olmadan veri kümesi. -
1.1.0
(varsayılan): kaldırır web içeriği.
-
İndirme boyutu:
2.59 MiB
Veri kümesi boyutu:
Unknown size
Manuel indirme talimatları: Bu veri kümesi içine elle kaynak verileri indirmenizi gerektirir
download_config.manual_dir
(varsayılan olarak~/tensorflow_datasets/downloads/manual/
):
(Özel bir komut dosyası çalıştırılmasını gerektirir) Ayrıntılı indir talimatlar şunlardır: https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md#running-the-download-and-extraction-scripts Daha sonra , lütfen xsum-extracts-from-downloads.tar.gz dosyasını manual_dir içine koyun.Otomatik önbelleğe ( dokümantasyon ): Bilinmeyen
Splits:
Bölmek | Örnekler |
---|---|
'test' | 11.301 |
'train' | 203.577 |
'validation' | 11.305 |
- Özellikler:
FeaturesDict({
'document': Text(shape=(), dtype=tf.string),
'summary': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('document', 'summary')
Şekil ( tfds.show_examples ): desteklenmez.
Örnekler ( tfds.as_dataframe ):
- Citation:
@article{Narayan2018DontGM,
title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
journal={ArXiv},
year={2018},
volume={abs/1808.08745}
}