snli

  • Description:

Le corpus SNLI (version 1.0) est une collection de 570 000 paires de phrases en anglais écrites par l'homme et étiquetées manuellement pour une classification équilibrée avec les étiquettes implication, contradiction et neutre, prenant en charge la tâche d'inférence de langage naturel (NLI), également connue sous le nom de reconnaissance d'implication textuelle (RTE).

Diviser Exemples
'test' 10 000
'train' 550 152
'validation' 10 000
  • Caractéristiques:
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'premise': Text(shape=(), dtype=tf.string),
})
  • citation:
@inproceedings{snli:emnlp2015,
    Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
    Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
    Publisher = {Association for Computational Linguistics},
    Title = {A large annotated corpus for learning natural language inference},
    Year = {2015}
}