raza

  • Descripción :

Race es un conjunto de datos de comprensión de lectura a gran escala con más de 28 000 pasajes y casi 100 000 preguntas. El conjunto de datos se recopila de los exámenes de inglés en China, que están diseñados para estudiantes de secundaria y preparatoria. El conjunto de datos se puede servir como conjuntos de entrenamiento y prueba para la comprensión de la máquina.

  • Descripción de la configuración : configuración del constructor para el conjunto de datos RACE.

  • Página de inicio: https://www.cs.cmu.edu/~glai1/data/race/

  • Código fuente : tfds.text.race.Race

  • Versiones :

    • 1.0.0 : Versión inicial.
    • 2.0.0 (predeterminado): agregue la identificación de ejemplo.
  • Tamaño de la descarga : 24.26 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Características :

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'article': Text(shape=(), dtype=tf.string),
    'example_id': Text(shape=(), dtype=tf.string),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

carrera/alto (configuración predeterminada)

  • Tamaño del conjunto de datos : 52.39 MiB

  • Divisiones :

Separar Ejemplos
'dev' 1,021
'test' 1,045
'train' 18,728

raza/medio

  • Tamaño del conjunto de datos : 12.51 MiB

  • Divisiones :

Separar Ejemplos
'dev' 368
'test' 362
'train' 6,409