امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

xsum

 • توضیحات :

مجموعه داده های خلاصه افراطی (XSum).

دو ویژگی وجود دارد: - سند: مقاله اخبار ورودی. - خلاصه: خلاصه یک جمله مقاله.

این داده ها باید بصورت دستی بارگیری و استخراج شوند ، همانطور که در https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md شرح داده شده است باید پوشه "xsum-extracts-from-downloads" فشرده سازی شود 'xsum-extracts-from-downloads.tar.gz' و در پوشه بارگیری دستی قرار دهید.

 • صفحه اصلی : https://github.com/EdinburghNLP/XSum/tree/master/XSum-Dataset

 • کد منبع : tfds.summarization.Xsum

 • نسخه ها :

  • 1.0.0 : مجموعه داده بدون تمیز کردن.
  • 1.1.0 (پیش فرض): محتوای وب را حذف می کند.
 • حجم بارگیری : 2.59 MiB

 • اندازه مجموعه داده : Unknown size

 • دستورالعمل های بارگیری دستی : برای این مجموعه داده لازم است که داده های منبع را به صورت دستی در download_config.manual_dir (به طور پیش فرض ~/tensorflow_datasets/downloads/manual/ ):
  دستورالعمل های دقیق بارگیری (که نیاز به اجرای یک اسکریپت سفارشی دارند) در اینجا هستند: https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md#running-the-download-and-extract-script بعد از آن لطفاً پرونده xsum-extracts-from-downloads.tar.gz را در manual_dir قرار دهید.

 • ذخیره خودکار ( مستندات ): ناشناخته است

 • تقسیم :

شکاف مثال ها
'test' 11،301
'train' 203،577
'validation' 11،305
 • ویژگی ها :
FeaturesDict({
  'document': Text(shape=(), dtype=tf.string),
  'summary': Text(shape=(), dtype=tf.string),
})
 • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('document', 'summary')

 • نقل قول :

@article{Narayan2018DontGM,
 title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
 author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
 journal={ArXiv},
 year={2018},
 volume={abs/1808.08745}
}