course

Descriptif :

Race est un ensemble de données de compréhension de lecture à grande échelle avec plus de 28 000 passages et près de 100 000 questions. L'ensemble de données est collecté à partir d'examens d'anglais en Chine, qui sont conçus pour les collégiens et lycéens. L'ensemble de données peut servir d'ensembles d'entraînement et de test pour la compréhension de la machine.

Documentation complémentaire : Explorer sur Papers With Code
Description de la configuration : configuration du générateur pour le jeu de données RACE.
Page d' accueil : https://www.cs.cmu.edu/~glai1/data/race/
Code source : tfds.datasets.race.Builder
Versions :
- 1.0.0 : Version initiale.
- 2.0.0 (par défaut) : Ajoutez l'exemple d'identifiant.
Taille du téléchargement : 24.26 MiB
Mise en cache automatique ( documentation ): Oui
Structure des fonctionnalités :

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})

Documentation des fonctionnalités :

Caractéristique	Classe	Façonner	Dtype
	FonctionnalitésDict
réponses	Séquence (texte)	(Aucun,)	chaîne de caractères
article	Texte		chaîne de caractères
example_id	Texte		chaîne de caractères
choix	Séquence(Séquence(Texte))	(Aucun, Aucun)	chaîne de caractères
des questions	Séquence (texte)	(Aucun,)	chaîne de caractères

Clés supervisées (Voir as_supervised doc ): None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :

@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

race/high (configuration par défaut)

Taille du jeu de données : 52.39 MiB
Fractionnements :

Diviser	Exemples
`'dev'`	1 021
`'test'`	1 045
`'train'`	18 728

Exemples ( tfds.as_dataframe ):

race/milieu

Taille du jeu de données : 12.51 MiB
Fractionnements :

Diviser	Exemples
`'dev'`	368
`'test'`	362
`'train'`	6 409

Exemples ( tfds.as_dataframe ):

course Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

race/high (configuration par défaut)

race/milieu

course