Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

xsum

  • Описание:

Набор данных Extreme Summarization (XSum).

Есть две функции: - документ: ввод новостной статьи. - краткое содержание: краткое изложение статьи, состоящее из одного предложения.

Эта потребность данных manaully загрузили и распаковали , как описано в https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md необходимости Тег загрузки xsum-экстракты-из-»папки для сжатия , как 'xsum-extracts-from-downloads.tar.gz' и поместите в загруженную вручную папку.

  • Домашняя страница: https://github.com/EdinburghNLP/XSum/tree/master/XSum-Dataset

  • Исходный код: tfds.summarization.Xsum

  • Версии:

    • 1.0.0 : Dataset без очистки.
    • 1.1.0 ( по умолчанию): веб - содержимое Удаляет.
  • Скачать Размер: 2.59 MiB

  • Dataset размер: Unknown size

  • Руководство по эксплуатации скачать: Этот набор данных требует от вас , чтобы загрузить исходные данные вручную в download_config.manual_dir ( по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    Детальнее скачать инструкции (которые требуют запуска пользовательского сценария) здесь: https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md#running-the-download-and-extraction-scripts После , поместите файл xsum-extracts-from-downloads.tar.gz в каталог manual_dir.

  • Авто-кэшируются ( документация ): Unknown

  • расколы:

Расколоть Примеры
'test' 11 301
'train' 203 577
'validation' 11 305
  • Особенности:
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
  • Образец цитирования:
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}