O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

xsum

  • Descrição:

Conjunto de dados de sumarização extrema (XSum).

Existem dois recursos: - documento: artigo de notícias de entrada. - resumo: resumo de uma frase do artigo.

Esta necessidade de dados para manaully baixado e extraiu-se tal como descrito no https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md A necessidade dos descargas xsum-extracts from-"pasta a ser comprimida conforme 'xsum-extract-from-downloads.tar.gz' e colocá-lo na pasta baixada manualmente.

Dividir Exemplos
'test' 11.301
'train' 203.577
'validation' 11.305
  • Características:
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
  • citação:
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}