qasc

  • Descripción :

QASC es un conjunto de datos de preguntas y respuestas centrado en la composición de oraciones. Consta de 9980 preguntas de opción múltiple de 8 vías sobre ciencias de la escuela primaria (8134 tren, 926 desarrollo, 920 prueba) y viene con un corpus de 17 millones de oraciones.

Separar Ejemplos
'test' 920
'train' 8,134
'validation' 926
  • Estructura de características :
FeaturesDict({
    'answerKey': Text(shape=(), dtype=string),
    'choices': Sequence({
        'label': Text(shape=(), dtype=string),
        'text': Text(shape=(), dtype=string),
    }),
    'combinedfact': Text(shape=(), dtype=string),
    'fact1': Text(shape=(), dtype=string),
    'fact2': Text(shape=(), dtype=string),
    'formatted_question': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
clave de respuesta Texto cadena
opciones Secuencia
opciones/etiqueta Texto cadena
opciones/texto Texto cadena
hecho combinado Texto cadena
hecho1 Texto cadena
hecho2 Texto cadena
pregunta_formateada Texto cadena
identificación Texto cadena
pregunta Texto cadena
  • Cita :
@article{allenai:qasc,
      author    = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
      title     = {QASC: A Dataset for Question Answering via Sentence Composition},
      journal   = {arXiv:1910.11473v2},
      year      = {2020},
}