Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

гонка

  • Описание :

Race — это крупномасштабный набор данных для понимания прочитанного, содержащий более 28 000 отрывков и почти 100 000 вопросов. Набор данных собран из экзаменов по английскому языку в Китае, которые предназначены для учащихся средних и старших классов. Набор данных можно использовать в качестве обучающего и тестового наборов для машинного понимания.

  • Описание конфигурации: конфигурация Builder для набора данных RACE.

  • Домашняя страница : https://www.cs.cmu.edu/~glai1/data/race/

  • Исходный код : tfds.text.race.Race

  • Версии :

    • 1.0.0 : Первоначальный выпуск.
    • 2.0.0 (по умолчанию): добавьте идентификатор примера.
  • Размер загрузки : 24.26 MiB

  • Автоматическое кэширование ( документация ): Да

  • Особенности :

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'article': Text(shape=(), dtype=tf.string),
    'example_id': Text(shape=(), dtype=tf.string),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

раса/высокая (конфигурация по умолчанию)

  • Размер набора данных : 52.39 MiB .

  • Сплиты :

Расколоть Примеры
'dev' 1021
'test' 1045
'train' 18 728

раса/середина

  • Размер набора данных : 12.51 MiB .

  • Сплиты :

Расколоть Примеры
'dev' 368
'test' 362
'train' 6409