Эта страница была переведа с помощью Cloud Translation API.
Switch to English

xsum

  • Описание :

Набор данных Extreme Summarization (XSum).

Есть две особенности:

  • документ: Введите новостную статью.
  • Резюме: Резюме статьи одним предложением.

Эти данные необходимо вручную загрузить и извлечь, как описано в https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md . Папку xsum-extract-from-downloads необходимо сжать как 'xsum-extract-from-downloads.tar.gz' и поместите в загруженную вручную папку.

  • Домашняя страница : https://github.com/EdinburghNLP/XSum/tree/master/XSum-Dataset

  • Исходный код : tfds.summarization.Xsum

  • Версии :

    • 1.1.0 (по умолчанию): без примечаний к выпуску.
    • 1.0.0 : без примечаний к выпуску.
  • Размер загрузки : 2.59 MiB

  • Размер набора данных : Unknown size

  • Инструкции по загрузке вручную : для этого набора данных необходимо вручную загрузить исходные данные в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    Подробные инструкции по загрузке (для которых требуется запуск пользовательского сценария) находятся здесь: https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md#running-the-download-and-extraction-scripts Afterwards , поместите файл xsum-extract-from-downloads.tar.gz в каталог manual_dir.

  • Автоматическое кэширование ( документация ): неизвестно

  • Сплит :

Трещина Примеры
'test' 11 301
'train' 203 577
'validation' 11 305
  • Особенности :
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
  • Контролируемые ключи (см. as_supervised doc ): ('document', 'summary')

  • Цитата :

@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}