billsum

  • Descripción :

BillSum, resumen de los proyectos de ley del Congreso de los EE. UU. y del estado de California.

Hay varias características: - texto: texto de la factura. - resumen: resumen de las facturas. - title: título de las facturas. características para nosotros facturas. ca facturas no tiene. - text_len: número de caracteres en el texto. - sum_len: número de caracteres en resumen.

Separar Ejemplos
'ca_test' 1,237
'test' 3,269
'train' 18,949
  • Estructura de características :
FeaturesDict({
    'summary': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
resumen Texto tf.cadena
texto Texto tf.cadena
título Texto tf.cadena
  • Cita :
@misc{kornilova2019billsum,
    title={BillSum: A Corpus for Automatic Summarization of US Legislation},
    author={Anastassia Kornilova and Vlad Eidelman},
    year={2019},
    eprint={1910.00523},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}