بیلسام

 • توضیحات :

BillSum، خلاصه ای از لوایح کنگره ایالات متحده و ایالت کالیفرنیا.

چندین ویژگی وجود دارد: - متن: متن صورتحساب. - خلاصه: خلاصه قبوض. - عنوان: عنوان لوایح. ویژگی ها برای ما صورتحساب. صورت حساب ca ندارد. - text_len: تعداد کاراکترها در متن. - sum_len: تعداد کاراکترها به طور خلاصه.

شکاف مثال ها
'ca_test' 1,237
'test' 3,269
'train' 18949
 • ساختار ویژگی :
FeaturesDict({
  'summary': Text(shape=(), dtype=string),
  'text': Text(shape=(), dtype=string),
  'title': Text(shape=(), dtype=string),
})
 • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
خلاصه متن رشته
متن متن رشته
عنوان متن رشته
 • نقل قول :
@misc{kornilova2019billsum,
  title={BillSum: A Corpus for Automatic Summarization of US Legislation},
  author={Anastassia Kornilova and Vlad Eidelman},
  year={2019},
  eprint={1910.00523},
  archivePrefix={arXiv},
  primaryClass={cs.CL}
}