نژاد

 • توضیحات :

Race یک مجموعه داده درک مطلب در مقیاس بزرگ با بیش از 28000 متن و نزدیک به 100000 سوال است. مجموعه داده از امتحانات انگلیسی در چین جمع آوری شده است که برای دانش آموزان دبیرستانی و دبیرستانی طراحی شده است. مجموعه داده را می توان به عنوان مجموعه آموزشی و آزمایشی برای درک ماشین استفاده کرد.

FeaturesDict({
  'answers': Sequence(Text(shape=(), dtype=string)),
  'article': Text(shape=(), dtype=string),
  'example_id': Text(shape=(), dtype=string),
  'options': Sequence(Sequence(Text(shape=(), dtype=string))),
  'questions': Sequence(Text(shape=(), dtype=string)),
})
 • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
پاسخ می دهد دنباله (متن) (هیچ یک،) رشته
مقاله متن رشته
example_id متن رشته
گزینه ها دنباله (توالی (متن)) (هیچ، هیچکدام) رشته
سوالات دنباله (متن) (هیچ یک،) رشته
@article{lai2017large,
  title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
  author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
  journal={arXiv preprint arXiv:1704.04683},
  year={2017}
}

مسابقه/بالا (پیکربندی پیش فرض)

 • حجم مجموعه داده : 52.39 MiB

 • تقسیم ها :

شکاف مثال ها
'dev' 1021
'test' 1,045
'train' 18728

نژاد / وسط

 • حجم مجموعه داده : 12.51 MiB

 • تقسیم ها :

شکاف مثال ها
'dev' 368
'test' 362
'train' 6,409