مكتاكو

  • الوصف :

MC-TACO عبارة عن مجموعة بيانات مكونة من 13 ألف زوج من الأسئلة والأجوبة التي تتطلب فهمًا زمنيًا منطقيًا. تحتوي مجموعة البيانات على خمس خصائص زمنية:

  1. المدة (كم من الوقت يستغرق الحدث)
  2. الترتيب الزمني (ترتيب نموذجي للأحداث)
  3. الوقت المعتاد (عند وقوع حدث ما)
  4. التردد (كم مرة يحدث الحدث)
  5. الثبات (سواء تم الحفاظ على الحالة لفترة طويلة جدًا أو إلى أجل غير مسمى)

نأمل أن تتمكن مجموعة البيانات هذه من تعزيز الاستكشاف المستقبلي لهذه الفئة المعينة من مشاكل التفكير.

ينقسم أمثلة
'test' 9442
'validation' 3،783
  • هيكل الميزة :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'question': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
إجابة نص خيط
فئة ClassLabel int64
ملصق ClassLabel int64
سؤال نص خيط
جملة نص خيط
  • الاقتباس :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}