multi_nouvelles

  • Description:

Multi-News, se compose d'articles de presse et de résumés écrits par des humains de ces articles du site newser.com. Chaque résumé est rédigé de manière professionnelle par des éditeurs et comprend des liens vers les articles originaux cités.

Il existe deux fonctionnalités : - document : texte des articles de presse séparés par un jeton spécial "|||||". - résumé : résumé de l'actualité.

Diviser Exemples
'test' 5 622
'train' 44 972
'validation' 5 622
  • Caractéristiques:
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
  • citation:
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}