- Описание :
Race - это крупномасштабный набор данных о понимании прочитанного, содержащий более 28 000 отрывков и почти 100 000 вопросов. Набор данных взят из экзаменов по английскому языку в Китае, которые предназначены для учащихся средних и старших классов. Набор данных может использоваться в качестве обучающих и тестовых наборов для машинного понимания.
Описание конфигурации: Конфигурация конструктора для набора данных RACE.
Домашняя страница : https://www.cs.cmu.edu/~glai1/data/race/
Исходный код :
tfds.text.race.Race
Версии :
-
1.0.0
: Первоначальный выпуск. -
2.0.0
(по умолчанию): добавьте идентификатор примера.
-
Размер загрузки :
24.26 MiB
Автоматическое кэширование ( документация ): Да
Особенности :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=tf.string)),
'article': Text(shape=(), dtype=tf.string),
'example_id': Text(shape=(), dtype=tf.string),
'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
Контролируемые ключи (см.
as_supervised
):None
Цитата :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
- Рисунок ( tfds.show_examples ): не поддерживается.
race / high (конфигурация по умолчанию)
Размер набора данных :
52.39 MiB
Сплит :
Трещина | Примеры |
---|---|
'dev' | 1,021 |
'test' | 1,045 |
'train' | 18 728 |
- Примеры ( tfds.as_dataframe ):
раса / средний
Размер набора данных :
12.51 MiB
Сплит :
Трещина | Примеры |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6 409 |
- Примеры ( tfds.as_dataframe ):