Эта страница была переведа с помощью Cloud Translation API.
Switch to English

multi_news

  • Описание :

Multi-News, состоит из новостных статей и написанных людьми резюме этих статей с сайта newser.com. Каждое резюме профессионально написано редакторами и включает ссылки на цитируемые оригинальные статьи.

Есть две особенности:

  • документ: текст новостных статей, разделенный специальным знаком «|||||».
  • Summary: сводка новостей.

  • Домашняя страница : https://github.com/Alex-Fabbri/Multi-News

  • Исходный код : tfds.summarization.MultiNews

  • Версии :

    • 1.0.0 (по умолчанию): без примечаний к выпуску.
  • Размер загрузки : 245.06 MiB

  • Размер набора данных : Unknown size

  • Автоматическое кэширование ( документация ): неизвестно

  • Сплит :

Трещина Примеры
'test' 5 622
'train' 44 972
'validation' 5 622
  • Особенности :
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
  • Контролируемые ключи (см. as_supervised doc ): ('document', 'summary')

  • Цитата :

@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}