एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

बिलसुम

  • विवरण:

बिलसम, यूएस कांग्रेसनल और कैलिफोर्निया राज्य के बिलों का सारांश।

कई विशेषताएं हैं: - पाठ: बिल पाठ। - सारांश: बिलों का सारांश। - शीर्षक: बिलों का शीर्षक। हमारे बिल के लिए सुविधाएँ। सीए बिल नहीं है। - text_len: पाठ में वर्णों की संख्या। - sum_len: संक्षेप में वर्णों की संख्या।

विभाजित करना उदाहरण
'ca_test' 1,237
'test' 3,269
'train' १८,९४९
  • विशेषताएं:
FeaturesDict({
    'summary': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
  • प्रशस्ति पत्र:
@misc{kornilova2019billsum,
    title={BillSum: A Corpus for Automatic Summarization of US Legislation},
    author={Anastassia Kornilova and Vlad Eidelman},
    year={2019},
    eprint={1910.00523},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}