ластик_multi_rc

Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.

  • Описание :

Eraser Multi RC — это набор данных для запросов по многострочным отрывкам вместе с ответами и обоснованием. Каждый пример в этом наборе данных состоит из следующих 5 частей.

  1. Многострочный пассаж 2. Вопрос о пассаже 3. Ответ на вопрос
  2. Классификация того, является ли ответ правильным или неправильным 5. Объяснение, обосновывающее классификацию
Расколоть Примеры
'test' 4848
'train' 24 029
'validation' 3214
  • Структура функции :
FeaturesDict({
    'evidences': Sequence(Text(shape=(), dtype=string)),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'passage': Text(shape=(), dtype=string),
    'query_and_answer': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
доказательства Последовательность (текст) (Никто,) нить
этикетка Метка класса int64
проход Текст нить
запрос_и_ответ Текст нить
  • Цитата :
@unpublished{eraser2019,
    title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
    author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
    author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
    title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
    booktitle = {NAACL},
    year = {2018}
}