respuesta_equivalencia

Descripción :

El conjunto de datos de equivalencia de respuesta contiene calificaciones humanas sobre predicciones de modelos de varios modelos en el conjunto de datos SQuAD. Las calificaciones establecen si la respuesta pronosticada es 'equivalente' a la respuesta dorada (teniendo en cuenta tanto la pregunta como el contexto).

Más específicamente, por 'equivalente' queremos decir que la respuesta predicha contiene al menos la misma información que la respuesta dorada y no agrega información superflua. El conjunto de datos contiene anotaciones para: * predicciones de BiDAF en SQuAD dev * predicciones de XLNet en SQuAD dev * predicciones de Luke en SQuAD dev * predicciones de Albert en SQuAD ejemplos de entrenamiento, desarrollo y prueba

Página de inicio: https://github.com/google-research-datasets/answer-equivalence-dataset
Código fuente : tfds.datasets.answer_equivalence.Builder
Versiones :
- 1.0.0 (predeterminado): versión inicial.
Tamaño de la descarga : 45.86 MiB
Tamaño del conjunto de datos : 47.24 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'ae_dev'`	4,446
`'ae_test'`	9,724
`'dev_bidaf'`	7,522
`'dev_luke'`	4,590
`'dev_xlnet'`	7,932
`'train'`	9,090

Estructura de características :

FeaturesDict({
    'candidate': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'gold_index': int32,
    'qid': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
    'question_1': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_2': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_3': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_4': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'reference': Text(shape=(), dtype=string),
    'score': float32,
})

Documentación de características :

Rasgo	Clase	Tipo D
	CaracterísticasDict
candidato	Texto	cuerda
contexto	Texto	cuerda
índice_oro	Tensor	int32
qid	Texto	cuerda
pregunta	Texto	cuerda
Pregunta 1	Etiqueta de clase	int64
Pregunta 2	Etiqueta de clase	int64
Pregunta 3	Etiqueta de clase	int64
pregunta_4	Etiqueta de clase	int64
referencia	Texto	cuerda
puntaje	Tensor	flotar32

Claves supervisadas (Ver as_supervised doc ): None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):

Cita :

@article{bulian-etal-2022-tomayto,
      title={Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation},
      author={Jannis Bulian and Christian Buck and Wojciech Gajewski and Benjamin Boerschinger and Tal Schuster},
      year={2022},
      eprint={2202.07654},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}