multi_news

  • Descriptif :

Multi-News, se compose d'articles d'actualité et de résumés rédigés par des humains de ces articles issus du site newser.com. Chaque résumé est rédigé de manière professionnelle par des éditeurs et comprend des liens vers les articles originaux cités.

Il y a deux fonctionnalités : - document : texte des articles de presse séparés par un jeton spécial "|||||". - résumé : résumé de l'actualité.

Diviser Exemples
'test' 5 622
'train' 44 972
'validation' 5 622
  • Structure des fonctionnalités :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
document Texte chaîne de caractères
sommaire Texte chaîne de caractères
  • Citation :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}