- Deskripsi :
Korpus Multi-Genre Natural Language Inference (MultiNLI) adalah kumpulan 433k pasangan kalimat bersumber dari kerumunan yang dianotasi dengan informasi teks tambahan. Korpus dimodelkan pada korpus SNLI, tetapi berbeda karena mencakup berbagai genre teks lisan dan tertulis, dan mendukung evaluasi generalisasi lintas genre yang khas. Korpus ini menjadi dasar tugas bersama Lokakarya RepEval 2017 di EMNLP di Kopenhagen.
Situs web : https://www.nyu.edu/projects/bowman/multinli/
Kode sumber :
tfds.text.MultiNLIMismatch
Versi :
-
0.1.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
216.34 MiB
Ukuran
90.91 MiB
data :90.91 MiB
Cache otomatis ( dokumentasi ): Ya
Split :
Membagi | Contoh |
---|---|
'train' | 392.702 |
'validation' | 10.000 |
- Fitur :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=tf.string),
'label': Text(shape=(), dtype=tf.string),
'premise': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Kutipan :
@InProceedings{N18-1101,
author = "Williams, Adina
and Nangia, Nikita
and Bowman, Samuel",
title = "A Broad-Coverage Challenge Corpus for
Sentence Understanding through Inference",
booktitle = "Proceedings of the 2018 Conference of
the North American Chapter of the
Association for Computational Linguistics:
Human Language Technologies, Volume 1 (Long
Papers)",
year = "2018",
publisher = "Association for Computational Linguistics",
pages = "1112--1122",
location = "New Orleans, Louisiana",
url = "http://aclweb.org/anthology/N18-1101"
}
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):