xsum

  • Descrição :

Conjunto de dados de sumarização extrema (XSum).

Existem dois recursos: - documento: entrada de artigo de notícias. - resumo: Resumo de uma frase do artigo.

Esses dados precisam ser baixados manualmente e extraídos conforme descrito em https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md A pasta 'xsum-extracts-from-downloads' precisa ser compactada como 'xsum-extracts-from-downloads.tar.gz' e coloque na pasta baixada manualmente.

Dividir Exemplos
'test' 11.301
'train' 203.577
'validation' 11.305
  • Estrutura de recursos :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
documento Texto corda
resumo Texto corda
  • Citação :
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}