infernal

Descripción :

El conjunto de datos HellaSwag es un punto de referencia para Commonsense NLI. Incluye un contexto y unas terminaciones que completan el contexto.

Documentación adicional : Explore en Papers With Code
Página de inicio: https://rowanzellers.com/hellaswag/
Código fuente : tfds.text.Hellaswag
Versiones :
- 0.0.1 : Sin notas de la versión.
- 1.0.0 : Adición de divisiones separadas para conjuntos de validación/prueba dentro y fuera del dominio.
- 1.1.0 (predeterminado): otra dimensión dividida para la fuente (wikihow vs activitynet)
Tamaño de la descarga : 68.18 MiB
Tamaño del conjunto de datos : 107.45 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'test'`	10,003
`'test_ind_activitynet'`	1,870
`'test_ind_wikihow'`	3,132
`'test_ood_activitynet'`	1,651
`'test_ood_wikihow'`	3,350
`'train'`	39,905
`'train_activitynet'`	14,740
`'train_wikihow'`	25,165
`'validation'`	10,042
`'validation_ind_activitynet'`	1,809
`'validation_ind_wikihow'`	3,192
`'validation_ood_activitynet'`	1,434
`'validation_ood_wikihow'`	3,607

Estructura de características :

FeaturesDict({
    'activity_label': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'endings': Sequence(Text(shape=(), dtype=string)),
    'label': int32,
    'source_id': Text(shape=(), dtype=string),
    'split_type': Text(shape=(), dtype=string),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
etiqueta_actividad	Texto		cuerda
contexto	Texto		cuerda
terminaciones	Secuencia (Texto)	(Ninguna,)	cuerda
etiqueta	Tensor		int32
source_id	Texto		cuerda
dividido	Texto		cuerda

Claves supervisadas (Ver as_supervised doc ): None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):

Cita :

@inproceedings{zellers2019hellaswag,
    title={HellaSwag: Can a Machine Really Finish Your Sentence?},
    author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
    booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
    year={2019}
}