- Descripción:
El conjunto de datos de HellaSwag es un punto de referencia para Commonsense NLI. Incluye un contexto y algunas terminaciones que completan el contexto.
El código fuente:
tfds.text.Hellaswag
versiones:
-
0.0.1
: No hay notas de la versión. -
1.0.0
: Adición de divisiones separadas para y fuera de dominio conjuntos de validación / prueba en-dominio. -
1.1.0
(predeterminado) : Otra dimensión de división para la fuente (wikihow vs activitynet)
-
Tamaño del paquete:
68.18 MiB
Conjunto de datos de tamaño:
107.45 MiB
Auto-caché ( documentación ): Sí
Fraccionamientos:
Separar | Ejemplos de |
---|---|
'test' | 10,003 |
'test_ind_activitynet' | 1.870 |
'test_ind_wikihow' | 3,132 |
'test_ood_activitynet' | 1,651 |
'test_ood_wikihow' | 3.350 |
'train' | 39,905 |
'train_activitynet' | 14,740 |
'train_wikihow' | 25,165 |
'validation' | 10.042 |
'validation_ind_activitynet' | 1.809 |
'validation_ind_wikihow' | 3,192 |
'validation_ood_activitynet' | 1.434 |
'validation_ood_wikihow' | 3.607 |
- características:
FeaturesDict({
'activity_label': Text(shape=(), dtype=tf.string),
'context': Text(shape=(), dtype=tf.string),
'endings': Sequence(Text(shape=(), dtype=tf.string)),
'label': tf.int32,
'source_id': Text(shape=(), dtype=tf.string),
'split_type': Text(shape=(), dtype=tf.string),
})
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): No soportado.
Ejemplos ( tfds.as_dataframe ):
- Cita:
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}