- توضیحات :
Race یک مجموعه داده درک مطلب در مقیاس بزرگ است که دارای بیش از 28000 متن و تقریباً 100000 سوال است. این مجموعه داده از امتحانات انگلیسی در چین جمع آوری شده است که برای دانش آموزان دوره راهنمایی و دبیرستان طراحی شده است. مجموعه داده می تواند به عنوان مجموعه آموزش و آزمون برای درک ماشین باشد.
توضیحات پیکربندی : پیکربندی سازنده برای مجموعه داده های RACE.
صفحه اصلی : https://www.cs.cmu.edu/~glai1/data/race/
کد منبع :
tfds.text.race.Race
نسخه ها :
-
1.0.0
: انتشار اولیه. -
2.0.0
(پیش فرض): شناسه مثال را اضافه کنید.
-
اندازه بارگیری :
24.26 MiB
ذخیره خودکار ( مستندات ): بله
ویژگی ها :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=tf.string)),
'article': Text(shape=(), dtype=tf.string),
'example_id': Text(shape=(), dtype=tf.string),
'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):None
نقل قول :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
- شکل ( tfds.show_examples ): پشتیبانی نمی شود.
race / high (پیکربندی پیش فرض)
اندازه مجموعه داده :
52.39 MiB
تقسیم :
شکاف | مثال ها |
---|---|
'dev' | 1021 |
'test' | 1045 |
'train' | 18،728 |
- مثالها ( tfds.as_dataframe ):
نژاد / وسط
اندازه مجموعه داده :
12.51 MiB
تقسیم :
شکاف | مثال ها |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6409 |
- مثالها ( tfds.as_dataframe ):