raça

  • Descrição :

Race é um conjunto de dados de compreensão de leitura em larga escala com mais de 28.000 passagens e quase 100.000 perguntas. O conjunto de dados é coletado de exames de inglês na China, que são projetados para alunos do ensino fundamental e médio. O conjunto de dados pode ser servido como conjuntos de treinamento e teste para compreensão da máquina.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • Documentação do recurso:
Funcionalidade Aula Forma Tipo D Descrição
RecursosDict
respostas Sequência (Texto) (Nenhum,) fragmento
artigo Texto fragmento
exemplo_id Texto fragmento
opções Sequência(Sequência(Texto)) (Nenhuma, Nenhuma) fragmento
questões Sequência (Texto) (Nenhum,) fragmento
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

corrida/alta (configuração padrão)

  • Tamanho do conjunto de dados : 52.39 MiB

  • Divisões :

Dividir Exemplos
'dev' 1.021
'test' 1.045
'train' 18.728

raça/meio

  • Tamanho do conjunto de dados : 12.51 MiB

  • Divisões :

Dividir Exemplos
'dev' 368
'test' 362
'train' 6.409