¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

raza

  • Descripción:

Race es un conjunto de datos de comprensión de lectura a gran escala con más de 28.000 pasajes y casi 100.000 preguntas. El conjunto de datos se recopila de los exámenes de inglés en China, que están diseñados para estudiantes de secundaria y preparatoria. El conjunto de datos puede servir como conjuntos de entrenamiento y prueba para la comprensión de la máquina.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'article': Text(shape=(), dtype=tf.string),
    'example_id': Text(shape=(), dtype=tf.string),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

carrera / alto (configuración predeterminada)

  • Conjunto de datos de tamaño: 52.39 MiB

  • Fraccionamientos:

Separar Ejemplos de
'dev' 1.021
'test' 1.045
'train' 18,728

raza / medio

  • Conjunto de datos de tamaño: 12.51 MiB

  • Fraccionamientos:

Separar Ejemplos de
'dev' 368
'test' 362
'train' 6.409