xsum

  • Descrizione:

Set di dati di riepilogo estremo (XSum).

Ci sono due caratteristiche: - documento: articolo di notizie di input. - sommario: riassunto di una frase dell'articolo.

Questo bisogno di dati scaricati manaully ed estratto come descritto nel https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md necessario il 'download xsum-estratti-da-' cartelle da comprimere come 'xsum-extracts-from-downloads.tar.gz' e mettilo nella cartella scaricata manualmente.

Diviso Esempi
'test' 11,301
'train' 203.577
'validation' 11,305
  • Caratteristiche:
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
  • citazione:
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}