eraser_multi_rc

  • Descrição :

Eraser Multi RC é um conjunto de dados para consultas em passagens de várias linhas, juntamente com respostas e uma justificativa. Cada exemplo neste conjunto de dados tem as 5 partes a seguir

  1. Uma passagem de múltiplas linhas 2. Uma pergunta sobre a passagem 3. Uma resposta à pergunta
  2. A Classificação sobre se a resposta está certa ou errada 5. Uma Explicação justificando a classificação
Dividir Exemplos
'test' 4.848
'train' 24.029
'validation' 3.214
  • Estrutura de recursos :
FeaturesDict({
    'evidences': Sequence(Text(shape=(), dtype=string)),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'passage': Text(shape=(), dtype=string),
    'query_and_answer': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
evidências Sequência (Texto) (Nenhum,) corda
etiqueta ClassLabel int64
passagem Texto corda
consulta_e_resposta Texto corda
  • Citação :
@unpublished{eraser2019,
    title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
    author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
    author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
    title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
    booktitle = {NAACL},
    year = {2018}
}