امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

xsum

  • توضیحات :

مجموعه داده های خلاصه افراطی (XSum).

دو ویژگی وجود دارد: - سند: مقاله اخبار ورودی. - خلاصه: خلاصه یک جمله مقاله.

این داده ها باید بصورت دستی بارگیری و استخراج شوند ، همانطور که در https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md شرح داده شده است باید پوشه "xsum-extracts-from-downloads" فشرده سازی شود 'xsum-extracts-from-downloads.tar.gz' و در پوشه بارگیری دستی قرار دهید.

  • صفحه اصلی : https://github.com/EdinburghNLP/XSum/tree/master/XSum-Dataset

  • کد منبع : tfds.summarization.Xsum

  • نسخه ها :

    • 1.0.0 : مجموعه داده بدون تمیز کردن.
    • 1.1.0 (پیش فرض): محتوای وب را حذف می کند.
  • حجم بارگیری : 2.59 MiB

  • اندازه مجموعه داده : Unknown size

  • دستورالعمل های بارگیری دستی : برای این مجموعه داده لازم است که داده های منبع را به صورت دستی در download_config.manual_dir (به طور پیش فرض ~/tensorflow_datasets/downloads/manual/ ):
    دستورالعمل های دقیق بارگیری (که نیاز به اجرای یک اسکریپت سفارشی دارند) در اینجا هستند: https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md#running-the-download-and-extract-script بعد از آن لطفاً پرونده xsum-extracts-from-downloads.tar.gz را در manual_dir قرار دهید.

  • ذخیره خودکار ( مستندات ): ناشناخته است

  • تقسیم :

شکاف مثال ها
'test' 11،301
'train' 203،577
'validation' 11،305
  • ویژگی ها :
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('document', 'summary')

  • نقل قول :

@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}