لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

مكتاكو

  • الوصف :

MC-TACO عبارة عن مجموعة بيانات تتكون من 13 ألف زوج من الأسئلة والأجوبة التي تتطلب فهمًا زمنيًا منطقيًا. تحتوي مجموعة البيانات على خمس خصائص زمنية:

  1. المدة (كم من الوقت يستغرق الحدث)
  2. الترتيب الزمني (ترتيب نموذجي للأحداث)
  3. الوقت المعتاد (عند وقوع حدث ما)
  4. التردد (كم مرة يحدث الحدث)
  5. الثبات (سواء تم الحفاظ على الحالة لفترة طويلة جدًا أو إلى أجل غير مسمى)

نأمل أن تتمكن مجموعة البيانات هذه من تعزيز الاستكشاف المستقبلي لهذه الفئة المعينة من مشاكل التفكير.

  • الصفحة الرئيسية : https://github.com/CogComp/MCTACO

  • كود المصدر : tfds.question_answering.Mctaco

  • إصدارات :

    • 1.0.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
  • حجم التحميل : 2.27 MiB

  • حجم مجموعة البيانات : 3.18 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الانقسامات :

انشق، مزق أمثلة
'test' 9442
'validation' 3،783
  • الميزات :
FeaturesDict({
    'answer': Text(shape=(), dtype=tf.string),
    'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'question': Text(shape=(), dtype=tf.string),
    'sentence': Text(shape=(), dtype=tf.string),
})
  • الاقتباس :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}