Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

Книжная сумма

  • Описание:

BookSum: набор наборов данных для подробного описания повествования

Эта реализация в настоящее время поддерживает только резюме книг и глав.

GitHub: https://github.com/salesforce/booksum

Папка с инструкциями должна содержать следующие каталоги:

- `booksum/`
- `all_chapterized_books/`
  • Авто-кэшируются ( документация ): Да (испытание, проверка), только когда shuffle_files=False (поезд)

  • Особенности:

FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
@article{kryscinski2021booksum,
      title={BookSum: A Collection of Datasets for Long-form Narrative Summarization},
      author={Wojciech Kry{'s}ci{'n}ski and Nazneen Rajani and Divyansh Agarwal and Caiming Xiong and Dragomir Radev},
      year={2021},
      eprint={2105.08209},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bookum / book (конфигурация по умолчанию)

  • Описание Config: Книга уровня реферирования

  • Dataset Размер: 208.81 MiB

  • расколы:

Расколоть Примеры
'test' 46
'train' 312
'validation' 45

Книжная сумма / глава

  • Описание Config: глава уровня реферирования

  • Dataset Размер: 216.71 MiB

  • расколы:

Расколоть Примеры
'test' 1,083
'train' 6 524
'validation' 891