qa4mre

  • Описание :

Набор данных QA4MRE был создан для общих задач CLEF 2011/2012/2013, чтобы продвигать исследования в области ответов на вопросы и понимания прочитанного. Набор данных содержит вспомогательный отрывок и набор вопросов, соответствующих отрывку. Для каждого вопроса предусмотрено несколько вариантов ответов, из которых только один правильный. Наборы обучающих и тестовых данных доступны для основного трека. Дополнительные документы золотого стандарта доступны для двух пилотных исследований: одно по данным о болезни Альцгеймера, а другое по данным вступительных экзаменов.

FeaturesDict({
    'answer_options': Sequence({
        'answer_id': Text(shape=(), dtype=string),
        'answer_str': Text(shape=(), dtype=string),
    }),
    'correct_answer_id': Text(shape=(), dtype=string),
    'correct_answer_str': Text(shape=(), dtype=string),
    'document_id': Text(shape=(), dtype=string),
    'document_str': Text(shape=(), dtype=string),
    'question_id': Text(shape=(), dtype=string),
    'question_str': Text(shape=(), dtype=string),
    'test_id': Text(shape=(), dtype=string),
    'topic_id': Text(shape=(), dtype=string),
    'topic_name': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
ответ_варианты Последовательность
answer_options/answer_id Текст нить
answer_options/answer_str Текст нить
правильный_ответ_id Текст нить
correct_answer_str Текст нить
document_id Текст нить
document_str Текст нить
id_вопроса Текст нить
question_str Текст нить
test_id Текст нить
ид_темы Текст нить
имя_темы Текст нить
@InProceedings{10.1007/978-3-642-40802-1_29,
author="Pe{\~{n} }as, Anselmo
and Hovy, Eduard
and Forner, Pamela
and Rodrigo, {\'A}lvaro
and Sutcliffe, Richard
and Morante, Roser",
editor="Forner, Pamela
and M{\"u}ller, Henning
and Paredes, Roberto
and Rosso, Paolo
and Stein, Benno",
title="QA4MRE 2011-2013: Overview of Question Answering for Machine Reading Evaluation",
booktitle="Information Access Evaluation. Multilinguality, Multimodality, and Visualization",
year="2013",
publisher="Springer Berlin Heidelberg",
address="Berlin, Heidelberg",
pages="303--320",
abstract="This paper describes the methodology for testing the performance of Machine Reading systems through Question Answering and Reading Comprehension Tests. This was the attempt of the QA4MRE challenge which was run as a Lab at CLEF 2011--2013. The traditional QA task was replaced by a new Machine Reading task, whose intention was to ask questions that required a deep knowledge of individual short texts and in which systems were required to choose one answer, by analysing the corresponding test document in conjunction with background text collections provided by the organization. Four different tasks have been organized during these years: Main Task, Processing Modality and Negation for Machine Reading, Machine Reading of Biomedical Texts about Alzheimer's disease, and Entrance Exams. This paper describes their motivation, their goals, their methodology for preparing the data sets, their background collections, their metrics used for the evaluation, and the lessons learned along these three years.",
isbn="978-3-642-40802-1"
}

qa4mre/2011.main.DE (конфигурация по умолчанию)

  • Описание конфига : Эта конфигурация включает основной трек для языка DE 2011 года.

  • Размер загрузки : 217.08 KiB

  • Размер набора данных : 1.69 MiB .

  • Сплиты :

Расколоть Примеры
'train' 120

qa4mre/2011.main.EN

  • Описание конфига : Эта конфигурация включает основной трек для языка EN в 2011 году.

  • Размер загрузки : 197.74 KiB

  • Размер набора данных : 1.52 MiB .

  • Сплиты :

Расколоть Примеры
'train' 120

qa4mre/2011.main.ES

  • Описание конфига : Данная конфигурация включает основной трек для языка ES 2011 года.

  • Размер загрузки : 212.52 KiB

  • Размер набора данных : 1.64 MiB .

  • Сплиты :

Расколоть Примеры
'train' 120

qa4mre/2011.main.IT

  • Описание конфига : Эта конфигурация включает в себя основной трек для IT языка в 2011 году.

  • Размер загрузки : 209.73 KiB

  • Размер набора данных : 1.61 MiB .

  • Сплиты :

Расколоть Примеры
'train' 120

qa4mre/2011.main.RO

  • Описание конфига : Эта конфигурация включает основной трек для языка RO в 2011 году.

  • Размер загрузки : 216.32 KiB

  • Размер набора данных : 1.68 MiB .

  • Сплиты :

Расколоть Примеры
'train' 120

qa4mre/2012.main.AR

  • Описание конфига : Эта конфигурация включает основной трек для языка AR в 2012 году.

  • Размер загрузки : 347.83 KiB

  • Размер набора данных : 2.62 MiB .

  • Сплиты :

Расколоть Примеры
'train' 160

qa4mre/2012.main.BG

  • Описание конфига : Данная конфигурация включает основной трек для языка БГ 2012 года.

  • Размер загрузки : 434.63 KiB

  • Размер набора данных : 3.33 MiB .

  • Сплиты :

Расколоть Примеры
'train' 160

qa4mre/2012.main.DE

  • Описание конфига : Эта конфигурация включает основной трек для языка DE 2012 года.

  • Размер загрузки : 275.00 KiB

  • Размер набора данных : 2.02 MiB

  • Сплиты :

Расколоть Примеры
'train' 160

qa4mre/2012.main.RU

  • Описание конфига : Эта конфигурация включает основной трек для языка EN в 2012 году.

  • Размер загрузки : 237.76 KiB

  • Размер набора данных : 1.71 MiB .

  • Сплиты :

Расколоть Примеры
'train' 160

qa4mre/2012.main.ES

  • Описание конфига : Данная конфигурация включает основной трек для языка ES 2012 года.

  • Размер загрузки : 271.92 KiB

  • Размер набора данных : 1.99 MiB .

  • Сплиты :

Расколоть Примеры
'train' 160

qa4mre/2012.main.IT

  • Описание конфига : Эта конфигурация включает в себя основной трек для ИТ языка в 2012 году.

  • Размер загрузки : 273.49 KiB

  • Размер набора данных : 2.01 MiB

  • Сплиты :

Расколоть Примеры
'train' 160

qa4mre/2012.main.RO

  • Описание конфига : Эта конфигурация включает основной трек для языка RO в 2012 году.

  • Размер загрузки : 272.99 KiB

  • Размер набора данных : 2.01 MiB

  • Сплиты :

Расколоть Примеры
'train' 160

qa4mre/2012.alzheimers.EN

  • Описание конфигурации: Эта конфигурация включает в себя трек болезни Альцгеймера для английского языка в 2012 году.

  • Размер загрузки : 173.19 KiB

  • Размер набора данных : 1.57 MiB .

  • Сплиты :

Расколоть Примеры
'train' 40

qa4mre/2013.main.AR

  • Описание конфига : Эта конфигурация включает основной трек для языка AR в 2013 году.

  • Размер загрузки : 369.44 KiB

  • Размер набора данных : 4.04 MiB

  • Сплиты :

Расколоть Примеры
'train' 284

qa4mre/2013.main.BG

  • Описание конфига : Эта конфигурация включает в себя основной трек для языка БГ в 2013 году.

  • Размер загрузки : 452.74 KiB

  • Размер набора данных : 5.21 MiB .

  • Сплиты :

Расколоть Примеры
'train' 284

qa4mre/2013.main.RU

  • Описание конфига : Данная конфигурация включает основной трек для языка EN в 2013 году.

  • Размер загрузки : 268.52 KiB

  • Размер набора данных : 2.81 MiB

  • Сплиты :

Расколоть Примеры
'train' 284

qa4mre/2013.main.ES

  • Описание конфига : Данная конфигурация включает основной трек для языка ES 2013 года.

  • Размер загрузки : 307.78 KiB

  • Размер набора данных : 3.35 MiB .

  • Сплиты :

Расколоть Примеры
'train' 284

qa4mre/2013.main.RO

  • Описание конфига : Эта конфигурация включает основной трек для языка RO в 2013 году.

  • Размер загрузки : 306.16 KiB

  • Размер набора данных : 3.26 MiB .

  • Сплиты :

Расколоть Примеры
'train' 284

qa4mre/2013.alzheimers.EN

  • Описание конфигурации: Эта конфигурация включает в себя трек болезни Альцгеймера для английского языка в 2013 году.

  • Размер загрузки : 267.98 KiB

  • Размер набора данных : 2.50 MiB .

  • Сплиты :

Расколоть Примеры
'train' 40

qa4mre/2013.entrance_exam.EN

  • Описание конфигурации: Эта конфигурация включает в себя трек entry_exam для английского языка в 2013 году.

  • Размер загрузки : 53.32 KiB

  • Размер набора данных : 186.01 KiB .

  • Сплиты :

Расколоть Примеры
'train' 46