qa4mre

  • الوصف :

تم إنشاء مجموعة بيانات QA4MRE للمهام المشتركة CLEF 2011/2012/2013 لتعزيز البحث في الإجابة على الأسئلة وفهم القراءة. تحتوي مجموعة البيانات على فقرة داعمة ومجموعة من الأسئلة المقابلة لهذا المقطع. تتوفر خيارات متعددة للإجابات لكل سؤال ، منها سؤال واحد فقط هو الصحيح. تتوفر مجموعات بيانات التدريب والاختبار للمسار الرئيسي. تتوفر وثائق قياسية ذهبية إضافية لدراستين تجريبيتين: واحدة حول بيانات مرض الزهايمر ، والأخرى حول بيانات امتحانات القبول.

FeaturesDict({
    'answer_options': Sequence({
        'answer_id': Text(shape=(), dtype=string),
        'answer_str': Text(shape=(), dtype=string),
    }),
    'correct_answer_id': Text(shape=(), dtype=string),
    'correct_answer_str': Text(shape=(), dtype=string),
    'document_id': Text(shape=(), dtype=string),
    'document_str': Text(shape=(), dtype=string),
    'question_id': Text(shape=(), dtype=string),
    'question_str': Text(shape=(), dtype=string),
    'test_id': Text(shape=(), dtype=string),
    'topic_id': Text(shape=(), dtype=string),
    'topic_name': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
answer_options تسلسل
answer_options / answer_id نص سلسلة
answer_options / answer_str نص سلسلة
معرّف_answer_answer_صحيح نص سلسلة
right_answer_str نص سلسلة
document_id نص سلسلة
document_str نص سلسلة
معرّف_السؤال نص سلسلة
question_str نص سلسلة
test_id نص سلسلة
topic_id نص سلسلة
اسم الموضوع نص سلسلة
@InProceedings{10.1007/978-3-642-40802-1_29,
author="Pe{\~{n} }as, Anselmo
and Hovy, Eduard
and Forner, Pamela
and Rodrigo, {\'A}lvaro
and Sutcliffe, Richard
and Morante, Roser",
editor="Forner, Pamela
and M{\"u}ller, Henning
and Paredes, Roberto
and Rosso, Paolo
and Stein, Benno",
title="QA4MRE 2011-2013: Overview of Question Answering for Machine Reading Evaluation",
booktitle="Information Access Evaluation. Multilinguality, Multimodality, and Visualization",
year="2013",
publisher="Springer Berlin Heidelberg",
address="Berlin, Heidelberg",
pages="303--320",
abstract="This paper describes the methodology for testing the performance of Machine Reading systems through Question Answering and Reading Comprehension Tests. This was the attempt of the QA4MRE challenge which was run as a Lab at CLEF 2011--2013. The traditional QA task was replaced by a new Machine Reading task, whose intention was to ask questions that required a deep knowledge of individual short texts and in which systems were required to choose one answer, by analysing the corresponding test document in conjunction with background text collections provided by the organization. Four different tasks have been organized during these years: Main Task, Processing Modality and Negation for Machine Reading, Machine Reading of Biomedical Texts about Alzheimer's disease, and Entrance Exams. This paper describes their motivation, their goals, their methodology for preparing the data sets, their background collections, their metrics used for the evaluation, and the lessons learned along these three years.",
isbn="978-3-642-40802-1"
}

qa4mre / 2011.main.DE (التكوين الافتراضي)

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة DE في عام 2011.

  • حجم التحميل : 217.08 KiB

  • حجم مجموعة البيانات : 1.69 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 120

qa4mre / 2011.main.EN

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة EN في عام 2011.

  • حجم التحميل : 197.74 KiB

  • حجم مجموعة البيانات : 1.52 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 120

qa4mre / 2011.main.ES

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة ES في عام 2011.

  • حجم التحميل : 212.52 KiB

  • حجم مجموعة البيانات : 1.64 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 120

qa4mre / 2011.main.IT

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة تكنولوجيا المعلومات في عام 2011.

  • حجم التحميل : 209.73 KiB

  • حجم مجموعة البيانات : 1.61 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 120

qa4mre / 2011.main.RO

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة RO في عام 2011.

  • حجم التحميل : 216.32 KiB

  • حجم مجموعة البيانات : 1.68 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 120

qa4mre / 2012.main.AR

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة AR في عام 2012.

  • حجم التحميل : 347.83 KiB

  • حجم مجموعة البيانات : 2.62 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 160

qa4mre / 2012.main.BG

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة BG في عام 2012.

  • حجم التحميل : 434.63 KiB

  • حجم مجموعة البيانات : 3.33 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 160

qa4mre / 2012.main.DE

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة DE في عام 2012.

  • حجم التحميل : 275.00 KiB

  • حجم مجموعة البيانات : 2.02 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 160

qa4mre / 2012.main.EN

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة EN في عام 2012.

  • حجم التحميل : 237.76 KiB

  • حجم مجموعة البيانات : 1.71 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 160

qa4mre / 2012.main.ES

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة ES في عام 2012.

  • حجم التحميل : 271.92 KiB

  • حجم مجموعة البيانات : 1.99 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 160

qa4mre / 2012.main.IT

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة تكنولوجيا المعلومات في عام 2012.

  • حجم التحميل : 273.49 KiB

  • حجم مجموعة البيانات : 2.01 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 160

qa4mre / 2012.main.RO

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة RO في عام 2012.

  • حجم التحميل : 272.99 KiB

  • حجم مجموعة البيانات : 2.01 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 160

qa4mre / 2012.alzheimers.EN

  • وصف التكوين : يتضمن هذا التكوين مسار alzheimers للغة EN في عام 2012.

  • حجم التحميل : 173.19 KiB

  • حجم مجموعة البيانات : 1.57 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 40

qa4mre / 2013.main.AR

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة AR في عام 2013.

  • حجم التحميل : 369.44 KiB

  • حجم مجموعة البيانات : 4.04 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 284

qa4mre / 2013.main.BG

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة BG في عام 2013.

  • حجم التحميل : 452.74 KiB

  • حجم مجموعة البيانات : 5.21 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 284

qa4mre / 2013.main.EN

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة EN في عام 2013.

  • حجم التحميل : 268.52 KiB

  • حجم مجموعة البيانات : 2.81 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 284

qa4mre / 2013.main.ES

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة ES في عام 2013.

  • حجم التحميل : 307.78 KiB

  • حجم مجموعة البيانات : 3.35 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 284

qa4mre / 2013.main.RO

  • وصف التكوين : يتضمن هذا التكوين المسار الرئيسي للغة RO في عام 2013.

  • حجم التحميل : 306.16 KiB

  • حجم مجموعة البيانات : 3.26 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 284

qa4mre / 2013.alzheimers.EN

  • وصف التكوين : يتضمن هذا التكوين مسار alzheimers للغة EN في عام 2013.

  • حجم التحميل : 267.98 KiB

  • حجم مجموعة البيانات : 2.50 MiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 40

qa4mre / 2013.entrance_exam.EN

  • وصف التكوين : يتضمن هذا التكوين مسار entry_exam للغة الإنجليزية في عام 2013.

  • حجم التحميل : 53.32 KiB

  • حجم مجموعة البيانات : 186.01 KiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 46