snli, snli

  • Descriptif :

Le corpus SNLI (version 1.0) est une collection de 570 000 paires de phrases en anglais écrites par des humains, étiquetées manuellement pour une classification équilibrée avec les étiquettes implication, contradiction et neutre, prenant en charge la tâche d'inférence du langage naturel (NLI), également connue sous le nom de reconnaissance de l'implication textuelle. (RTE).

Diviser Exemples
'test' 10 000
'train' 550 152
'validation' 10 000
  • Structure des fonctionnalités :
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
hypothèse Texte chaîne
étiquette Étiquette de classe int64
prémisse Texte chaîne
  • Citation :
@inproceedings{snli:emnlp2015,
    Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
    Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
    Publisher = {Association for Computational Linguistics},
    Title = {A large annotated corpus for learning natural language inference},
    Year = {2015}
}