- Descripción:
El corpus SNLI (versión 1.0) es una colección de 570k pares de oraciones en inglés escritas por humanos y etiquetadas manualmente para una clasificación equilibrada con las etiquetas implicación, contradicción y neutral, que respaldan la tarea de inferencia del lenguaje natural (NLI), también conocida como reconocimiento de implicación textual (RTE).
El código fuente:
tfds.text.Snli
versiones:
-
1.1.0
(por defecto): No hay notas de la versión.
-
Tamaño del paquete:
90.17 MiB
Conjunto de datos de tamaño:
87.00 MiB
Auto-caché ( documentación ): Sí
Fraccionamientos:
Separar | Ejemplos de |
---|---|
'test' | 10,000 |
'train' | 550,152 |
'validation' | 10,000 |
- características:
FeaturesDict({
'hypothesis': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'premise': Text(shape=(), dtype=tf.string),
})
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): No soportado.
Ejemplos ( tfds.as_dataframe ):
- Cita:
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}