mctaco

  • Description:

MC-TACO est un ensemble de données de 13 000 paires de questions-réponses qui nécessitent une compréhension temporelle de bon sens. L'ensemble de données contient cinq propriétés temporelles :

  1. durée (combien de temps prend un événement)
  2. ordre temporel (ordre typique des événements)
  3. heure typique (quand un événement se produit)
  4. fréquence (combien de fois un événement se produit)
  5. stationnarité (qu'un état soit maintenu très longtemps ou indéfiniment)

Nous espérons que cet ensemble de données pourra promouvoir l'exploration future de cette classe particulière de problèmes de raisonnement.

Diviser Exemples
'test' 9 442
'validation' 3 783
  • Caractéristiques:
FeaturesDict({
    'answer': Text(shape=(), dtype=tf.string),
    'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'question': Text(shape=(), dtype=tf.string),
    'sentence': Text(shape=(), dtype=tf.string),
})
  • citation:
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}