mctaco

  • Descripción :

MC-TACO es un conjunto de datos de 13k pares de preguntas y respuestas que requieren comprensión temporal de sentido común. El conjunto de datos contiene cinco propiedades temporales:

  1. duración (cuánto dura un evento)
  2. ordenamiento temporal (orden típico de los eventos)
  3. tiempo típico (cuando ocurre un evento)
  4. frecuencia (con qué frecuencia ocurre un evento)
  5. estacionariedad (si un estado se mantiene durante mucho tiempo o indefinidamente)

Esperamos que este conjunto de datos pueda promover la exploración futura de esta clase particular de problemas de razonamiento.

Dividir Ejemplos
'test' 9,442
'validation' 3,783
  • Estructura de características :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'question': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • Documentación de características :
Característica Clase Forma Tipo D Descripción
CaracterísticasDict
respuesta Texto cadena
categoría Etiqueta de clase int64
etiqueta Etiqueta de clase int64
pregunta Texto cadena
oración Texto cadena
  • Cita :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}