- Описание:
Набор данных Extreme Summarization (XSum).
Есть две функции: - документ: ввод новостной статьи. - краткое содержание: краткое изложение статьи, состоящее из одного предложения.
Эта потребность данных manaully загрузили и распаковали , как описано в https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md необходимости Тег загрузки xsum-экстракты-из-»папки для сжатия , как 'xsum-extracts-from-downloads.tar.gz' и поместите в загруженную вручную папку.
Домашняя страница: https://github.com/EdinburghNLP/XSum/tree/master/XSum-Dataset
Исходный код:
tfds.summarization.Xsum
Версии:
-
1.0.0
: Dataset без очистки. -
1.1.0
( по умолчанию): веб - содержимое Удаляет.
-
Скачать Размер:
2.59 MiB
Dataset размер:
Unknown size
Руководство по эксплуатации скачать: Этот набор данных требует от вас , чтобы загрузить исходные данные вручную в
download_config.manual_dir
( по умолчанию~/tensorflow_datasets/downloads/manual/
):
Детальнее скачать инструкции (которые требуют запуска пользовательского сценария) здесь: https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md#running-the-download-and-extraction-scripts После , поместите файл xsum-extracts-from-downloads.tar.gz в каталог manual_dir.Авто-кэшируются ( документация ): Unknown
расколы:
Расколоть | Примеры |
---|---|
'test' | 11 301 |
'train' | 203 577 |
'validation' | 11 305 |
- Особенности:
FeaturesDict({
'document': Text(shape=(), dtype=tf.string),
'summary': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('document', 'summary')
Рис ( tfds.show_examples ): Не поддерживается.
Примеры ( tfds.as_dataframe ):
- Образец цитирования:
@article{Narayan2018DontGM,
title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
journal={ArXiv},
year={2018},
volume={abs/1808.08745}
}