qasc

  • Descrição :

O QASC é um conjunto de dados de resposta a perguntas com foco na composição de frases. Ele consiste em 9.980 questões de múltipla escolha de 8 vias sobre ciências do ensino fundamental (8.134 train, 926 dev, 920 test) e vem com um corpus de 17 milhões de sentenças.

Dividir Exemplos
'test' 920
'train' 8.134
'validation' 926
  • Estrutura de recursos :
FeaturesDict({
    'answerKey': Text(shape=(), dtype=string),
    'choices': Sequence({
        'label': Text(shape=(), dtype=string),
        'text': Text(shape=(), dtype=string),
    }),
    'combinedfact': Text(shape=(), dtype=string),
    'fact1': Text(shape=(), dtype=string),
    'fact2': Text(shape=(), dtype=string),
    'formatted_question': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Funcionalidade Aula Forma Tipo D Descrição
RecursosDict
palavra chave Texto fragmento
escolhas Seqüência
escolhas/rótulo Texto fragmento
escolhas/texto Texto fragmento
fato combinado Texto fragmento
fato1 Texto fragmento
fato2 Texto fragmento
pergunta_formatada Texto fragmento
Eu iria Texto fragmento
pergunta Texto fragmento
  • Citação :
@article{allenai:qasc,
      author    = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
      title     = {QASC: A Dataset for Question Answering via Sentence Composition},
      journal   = {arXiv:1910.11473v2},
      year      = {2020},
}