billsum

  • תיאור :

BillSum, סיכום הצעות חוק של הקונגרס האמריקאי ומדינת קליפורניה.

ישנן מספר תכונות: - טקסט: טקסט שטר. - סיכום: סיכום החשבונות. - כותרת: כותרת השטרות. תכונות עבורנו שטרות. לשטרות ca אין. - text_len: מספר תווים בטקסט. - sum_len: מספר התווים בסיכום.

לְפַצֵל דוגמאות
'ca_test' 1,237
'test' 3,269
'train' 18,949
  • מבנה תכונה :
FeaturesDict({
    'summary': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
סיכום טֶקסט חוּט
טֶקסט טֶקסט חוּט
כותרת טֶקסט חוּט
  • ציטוט :
@misc{kornilova2019billsum,
    title={BillSum: A Corpus for Automatic Summarization of US Legislation},
    author={Anastassia Kornilova and Vlad Eidelman},
    year={2019},
    eprint={1910.00523},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}