гонка

  • Описание :

Race — это крупномасштабный набор данных для понимания прочитанного, содержащий более 28 000 отрывков и почти 100 000 вопросов. Набор данных собран из экзаменов по английскому языку в Китае, которые предназначены для учащихся средних и старших классов. Набор данных можно использовать в качестве обучающего и тестового наборов для машинного понимания.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
ответы Последовательность (текст) (Никто,) нить
статья Текст нить
example_id Текст нить
параметры Последовательность(Последовательность(Текст)) (Нет, Нет) нить
вопросы Последовательность (текст) (Никто,) нить
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

раса/высокая (конфигурация по умолчанию)

  • Размер набора данных : 52.39 MiB .

  • Сплиты :

Расколоть Примеры
'dev' 1021
'test' 1045
'train' 18 728

раса/середина

  • Размер набора данных : 12.51 MiB .

  • Сплиты :

Расколоть Примеры
'dev' 368
'test' 362
'train' 6409