Mctaco

  • Descriptif :

MC-TACO est un ensemble de données de 13 000 paires de questions-réponses qui nécessitent une compréhension de bon sens temporel. Le jeu de données contient cinq propriétés temporelles :

  1. durée (combien de temps dure un événement)
  2. ordre temporel (ordre typique des événements)
  3. heure typique (lorsqu'un événement se produit)
  4. fréquence (la fréquence à laquelle un événement se produit)
  5. stationnarité (qu'un état soit maintenu très longtemps ou indéfiniment)

Nous espérons que cet ensemble de données pourra promouvoir l'exploration future de cette classe particulière de problèmes de raisonnement.

Diviser Exemples
'test' 9 442
'validation' 3 783
  • Structure des fonctionnalités :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'question': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Dtype Description
FonctionnalitésDict
répondre Texte chaîne
catégorie Étiquette de classe int64
étiqueter Étiquette de classe int64
question Texte chaîne
phrase Texte chaîne
  • Citation :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}