O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

Billum

  • Descrição:

BillSum, resumo dos projetos de lei do Congresso dos EUA e do estado da Califórnia.

Existem vários recursos: - texto: texto da conta. - resumo: resumo das contas. - título: título das contas. recursos para contas de nós. contas ca não tem. - text_len: número de caracteres no texto. - sum_len: número de caracteres no resumo.

Dividir Exemplos
'ca_test' 1.237
'test' 3.269
'train' 18.949
  • Características:
FeaturesDict({
    'summary': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
  • citação:
@misc{kornilova2019billsum,
    title={BillSum: A Corpus for Automatic Summarization of US Legislation},
    author={Anastassia Kornilova and Vlad Eidelman},
    year={2019},
    eprint={1910.00523},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}