- توضیحات :
چند خبری ، شامل مقالات خبری و خلاصه نوشته شده توسط انسان از سایت newser.com است. هر خلاصه به طور حرفه ای توسط ویراستاران نوشته شده است و شامل پیوندهایی به مقالات اصلی استناد شده است.
دو ویژگی وجود دارد: - سند: متن مقاله های خبری جدا شده توسط رمز ویژه "|||||". - خلاصه: خلاصه خبر.
صفحه اصلی : https://github.com/Alex-Fabbri/Multi-News
کد منبع :
tfds.summarization.MultiNews
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
245.06 MiB
اندازه مجموعه داده :
Unknown size
ذخیره خودکار ( مستندات ): ناشناخته است
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 5622 |
'train' | 44،972 |
'validation' | 5622 |
- ویژگی ها :
FeaturesDict({
'document': Text(shape=(), dtype=tf.string),
'summary': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('document', 'summary')
نقل قول :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):