course

  • Description:

Race est un ensemble de données de compréhension de lecture à grande échelle avec plus de 28 000 passages et près de 100 000 questions. L'ensemble de données est collecté à partir d'examens d'anglais en Chine, qui sont conçus pour les collégiens et les lycéens. L'ensemble de données peut être utilisé comme ensemble d'entraînement et de test pour la compréhension de la machine.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'article': Text(shape=(), dtype=tf.string),
    'example_id': Text(shape=(), dtype=tf.string),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

race/high (configuration par défaut)

  • Dataset Taille: 52.39 MiB

  • scissions:

Diviser Exemples
'dev' 1 021
'test' 1 045
'train' 18 728

race/milieu

  • Dataset Taille: 12.51 MiB

  • scissions:

Diviser Exemples
'dev' 368
'test' 362
'train' 6 409