- Descripción :
Race es un conjunto de datos de comprensión de lectura a gran escala con más de 28 000 pasajes y casi 100 000 preguntas. El conjunto de datos se recopila de los exámenes de inglés en China, que están diseñados para estudiantes de secundaria y preparatoria. El conjunto de datos se puede servir como conjuntos de entrenamiento y prueba para la comprensión de la máquina.
Descripción de la configuración : configuración del constructor para el conjunto de datos RACE.
Página de inicio: https://www.cs.cmu.edu/~glai1/data/race/
Código fuente :
tfds.text.race.Race
Versiones :
-
1.0.0
: Versión inicial. -
2.0.0
(predeterminado): agregue la identificación de ejemplo.
-
Tamaño de la descarga :
24.26 MiB
Almacenamiento automático en caché ( documentación ): Sí
Características :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=tf.string)),
'article': Text(shape=(), dtype=tf.string),
'example_id': Text(shape=(), dtype=tf.string),
'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Cita :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
carrera/alto (configuración predeterminada)
Tamaño del conjunto de datos :
52.39 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'dev' | 1,021 |
'test' | 1,045 |
'train' | 18,728 |
- Ejemplos ( tfds.as_dataframe ):
raza/medio
Tamaño del conjunto de datos :
12.51 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6,409 |
- Ejemplos ( tfds.as_dataframe ):