מקטאקו

  • תיאור :

MC-TACO הוא מערך נתונים של 13,000 צמדי שאלות ותשובות הדורשים הבנה זמנית של שכל. מערך הנתונים מכיל חמישה מאפיינים זמניים:

  1. משך (כמה זמן לוקח אירוע)
  2. סדר זמני (סדר אופייני של אירועים)
  3. זמן טיפוסי (כאשר מתרחש אירוע)
  4. תדירות (באיזו תדירות מתרחש אירוע)
  5. נייחות (בין אם מצב נשמר במשך זמן רב מאוד או ללא הגבלת זמן)

אנו מקווים שמערך נתונים זה יכול לקדם את החקירה העתידית של סוג זה של בעיות חשיבה ספציפיות.

לְפַצֵל דוגמאות
'test' 9,442
'validation' 3,783
  • מבנה תכונה :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'question': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תשובה טֶקסט חוּט
קטגוריה ClassLabel int64
תווית ClassLabel int64
שְׁאֵלָה טֶקסט חוּט
משפט טֶקסט חוּט
  • ציטוט :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}