نژاد

  • توضیحات :

Race یک مجموعه داده درک مطلب در مقیاس بزرگ با بیش از 28000 متن و نزدیک به 100000 سوال است. مجموعه داده از امتحانات انگلیسی در چین جمع آوری شده است که برای دانش آموزان دبیرستانی و دبیرستانی طراحی شده است. مجموعه داده را می توان به عنوان مجموعه آموزشی و آزمایشی برای درک ماشین استفاده کرد.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
پاسخ می دهد دنباله (متن) (هیچ یک،) رشته
مقاله متن رشته
example_id متن رشته
گزینه ها دنباله (توالی (متن)) (هیچ، هیچکدام) رشته
سوالات دنباله (متن) (هیچ یک،) رشته
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

مسابقه/بالا (پیکربندی پیش فرض)

  • حجم مجموعه داده : 52.39 MiB

  • تقسیم ها :

شکاف مثال ها
'dev' 1021
'test' 1,045
'train' 18728

نژاد / وسط

  • حجم مجموعه داده : 12.51 MiB

  • تقسیم ها :

شکاف مثال ها
'dev' 368
'test' 362
'train' 6,409