eraser_multi_rc

  • توضیحات :

Eraser Multi RC مجموعه داده ای برای پرس و جوها در قسمت های چند خطی، همراه با پاسخ ها و منطق است. هر نمونه در این مجموعه داده دارای 5 بخش زیر است

  1. یک متن چند خطی 2. یک پرس و جو در مورد قطعه 3. یک پاسخ به پرس و جو
  2. طبقه بندی درست یا غلط بودن پاسخ 5. توضیحی که طبقه بندی را توجیه می کند
شکاف مثال ها
'test' 4,848
'train' 24,029
'validation' 3,214
  • ساختار ویژگی :
FeaturesDict({
    'evidences': Sequence(Text(shape=(), dtype=string)),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'passage': Text(shape=(), dtype=string),
    'query_and_answer': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
شواهد دنباله (متن) (هیچ یک،) رشته
برچسب ClassLabel int64
گذر متن رشته
query_and_answer متن رشته
  • نقل قول :
@unpublished{eraser2019,
    title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
    author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
    author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
    title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
    booktitle = {NAACL},
    year = {2018}
}