O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

corrida

  • Descrição:

Race é um conjunto de dados de compreensão de leitura em grande escala com mais de 28.000 passagens e quase 100.000 perguntas. O conjunto de dados é coletado a partir de exames de inglês na China, projetados para alunos do ensino fundamental e médio. O conjunto de dados pode ser usado como conjunto de treinamento e teste para compreensão da máquina.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'article': Text(shape=(), dtype=tf.string),
    'example_id': Text(shape=(), dtype=tf.string),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

raça / alta (configuração padrão)

  • Dataset tamanho: 52.39 MiB

  • desdobramentos:

Dividir Exemplos
'dev' 1.021
'test' 1.045
'train' 18.728

raça / meio

  • Dataset tamanho: 12.51 MiB

  • desdobramentos:

Dividir Exemplos
'dev' 368
'test' 362
'train' 6.409