الممحاة

  • الوصف :

Eraser Multi RC هي مجموعة بيانات للاستعلامات عبر مقاطع متعددة الأسطر ، جنبًا إلى جنب مع الإجابات والتعليل المنطقي. يحتوي كل مثال في مجموعة البيانات هذه على الأجزاء الخمسة التالية

  1. ممر متعدد الخطوط 2. استعلام عن المقطع 3. إجابة على الاستعلام
  2. تصنيف ما إذا كانت الإجابة صحيحة أم خاطئة 5. شرح يبرر التصنيف
انشق، مزق أمثلة
'test' 4848
'train' 24،029
'validation' 3214
  • هيكل الميزة :
FeaturesDict({
    'evidences': Sequence(Text(shape=(), dtype=string)),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'passage': Text(shape=(), dtype=string),
    'query_and_answer': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
الأدلة تسلسل (نص) (لا أحد،) سلسلة
ضع الكلمة المناسبة ClassLabel int64
الممر نص سلسلة
الاستعلام_و_الإجابة نص سلسلة
  • الاقتباس :
@unpublished{eraser2019,
    title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
    author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
    author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
    title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
    booktitle = {NAACL},
    year = {2018}
}