- Deskripsi :
Korpus SNLI (versi 1.0) adalah kumpulan 570k pasangan kalimat bahasa Inggris yang ditulis manusia yang diberi label secara manual untuk klasifikasi yang seimbang dengan label entailment, kontradiksi, dan netral, mendukung tugas inferensi bahasa alami (NLI), juga dikenal sebagai mengenali entailment tekstual (RTE).
Situs web : https://nlp.stanford.edu/projects/snli/
Kode sumber :
tfds.text.Snli
Versi :
-
1.1.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
90.17 MiB
Ukuran set data :
87.00 MiB
Cache otomatis ( dokumentasi ): Ya
Split :
Membagi | Contoh |
---|---|
'test' | 10.000 |
'train' | 550.152 |
'validation' | 10.000 |
- Fitur :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'premise': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Kutipan :
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):