- Descripción:
Eraser Multi RC es un conjunto de datos para consultas sobre pasajes de varias líneas, junto con respuestas y un razonamiento. Cada ejemplo en este conjunto de datos tiene las siguientes 5 partes
- Un pasaje de varias líneas 2. Una consulta sobre el pasaje 3. Una respuesta a la consulta
- Una clasificación sobre si la respuesta es correcta o incorrecta 5. Una explicación que justifica la clasificación
El código fuente:
tfds.text.EraserMultiRc
versiones:
-
0.1.1
(por defecto): No hay notas de la versión.
-
Tamaño del paquete:
1.59 MiB
Tamaño de conjunto de datos:
Unknown size
Auto-caché ( documentación ): Desconocido
Fraccionamientos:
Separar | Ejemplos de |
---|---|
'test' | 4.848 |
'train' | 24,029 |
'validation' | 3,214 |
- características:
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=tf.string)),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'passage': Text(shape=(), dtype=tf.string),
'query_and_answer': Text(shape=(), dtype=tf.string),
})
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): No soportado.
Ejemplos ( tfds.as_dataframe ):
- Cita:
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}