¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

xsum

  • Descripción:

Conjunto de datos de resumen extremo (XSum).

Hay dos características: - Documento: Entrada de artículo de noticias. - resumen: resumen de una oración del artículo.

Esta necesidad de datos a descargar, y se extrajo manaully como se describe en https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md necesidad 'Las descargas Xsum extractos-de-carpeta' a ser comprimido como 'xsum-extracts-from-downloads.tar.gz' y colóquelo en la carpeta descargada manualmente.

Separar Ejemplos de
'test' 11.301
'train' 203,577
'validation' 11.305
  • características:
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
  • Cita:
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}