mctaco

  • תיאור:

MC-TACO הוא מערך של 13,000 זוגות שאלות ותשובות הדורשות הבנה של חוסר תחושה זמנית. מערך הנתונים מכיל חמישה מאפיינים זמניים:

  1. משך הזמן (כמה זמן לוקח לאירוע)
  2. סדר זמני (סדר אירועים אופייני)
  3. זמן אופייני (כאשר מתרחש אירוע)
  4. תדירות (באיזו תדירות אירוע מתרחש)
  5. נייחות (בין אם המדינה נשמרת לאורך זמן או בלתי מוגבל)

אנו מקווים שמערך הנתונים הזה יכול לקדם את החקירה העתידית של סוג זה של בעיות נימוק.

לְפַצֵל דוגמאות
'test' 9,442
'validation' 3,783
  • מאפיינים:
FeaturesDict({
    'answer': Text(shape=(), dtype=tf.string),
    'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'question': Text(shape=(), dtype=tf.string),
    'sentence': Text(shape=(), dtype=tf.string),
})
  • ציטוט:
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}