course

  • Descriptif :

Race est un ensemble de données de compréhension de lecture à grande échelle avec plus de 28 000 passages et près de 100 000 questions. L'ensemble de données est collecté à partir d'examens d'anglais en Chine, qui sont conçus pour les collégiens et lycéens. L'ensemble de données peut servir d'ensembles d'entraînement et de test pour la compréhension de la machine.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • Documentation des fonctionnalités :
Caractéristique Classe Façonner Dtype Description
FonctionnalitésDict
réponses Séquence (texte) (Aucun,) chaîne de caractères
article Texte chaîne de caractères
example_id Texte chaîne de caractères
choix Séquence(Séquence(Texte)) (Aucun, Aucun) chaîne de caractères
des questions Séquence (texte) (Aucun,) chaîne de caractères
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

race/high (configuration par défaut)

  • Taille du jeu de données : 52.39 MiB

  • Fractionnements :

Diviser Exemples
'dev' 1 021
'test' 1 045
'train' 18 728

race/milieu

  • Taille du jeu de données : 12.51 MiB

  • Fractionnements :

Diviser Exemples
'dev' 368
'test' 362
'train' 6 409