בילסום

 • תיאור:

BillSum, סיכום הצעות החוק של הקונגרס האמריקאי וקליפורניה.

ישנן מספר תכונות: - טקסט: טקסט שטר. - סיכום: סיכום השטרות. - כותרת: כותרת השטרות. תכונות עבורנו שטרות. לשטרות ca אין. - text_len: מספר תווים בטקסט. - sum_len: מספר תווים לסיכום.

לְפַצֵל דוגמאות
'ca_test' 1,237
'test' 3,269
'train' 18,949
 • מאפיינים:
FeaturesDict({
  'summary': Text(shape=(), dtype=tf.string),
  'text': Text(shape=(), dtype=tf.string),
  'title': Text(shape=(), dtype=tf.string),
})
 • ציטוט:
@misc{kornilova2019billsum,
  title={BillSum: A Corpus for Automatic Summarization of US Legislation},
  author={Anastassia Kornilova and Vlad Eidelman},
  year={2019},
  eprint={1910.00523},
  archivePrefix={arXiv},
  primaryClass={cs.CL}
}