- Açıklama:
Çok Türlü Doğal Dil Çıkarımı (MultiNLI) külliyatı, metinsel gereklilik bilgileriyle açıklamalı 433 bin cümle çiftinin kitle kaynaklı bir koleksiyonudur. Derlem, SNLI derlemi üzerinde modellenmiştir, ancak sözlü ve yazılı metin türlerinin bir dizisini kapsaması ve ayırt edici bir türler arası genelleme değerlendirmesini desteklemesi bakımından farklılık gösterir. Derlem, Kopenhag'daki EMNLP'deki RepEval 2017 Çalıştayının ortak görevinin temelini oluşturdu.
Kaynak kodu:
tfds.text.MultiNLI
sürümleri:
-
1.1.0
(varsayılan): Hayır sürüm notları.
-
İndirme boyutu:
216.34 MiB
Veri kümesi boyutu:
89.50 MiB
Otomatik önbelleğe ( dokümantasyon ): Evet
Splits:
Bölmek | Örnekler |
---|---|
'train' | 392.702 |
'validation_matched' | 9.815 |
'validation_mismatched' | 9.832 |
- Özellikler:
FeaturesDict({
'hypothesis': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'premise': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): desteklenmez.
Örnekler ( tfds.as_dataframe ):
- Citation:
@InProceedings{N18-1101,
author = "Williams, Adina
and Nangia, Nikita
and Bowman, Samuel",
title = "A Broad-Coverage Challenge Corpus for
Sentence Understanding through Inference",
booktitle = "Proceedings of the 2018 Conference of
the North American Chapter of the
Association for Computational Linguistics:
Human Language Technologies, Volume 1 (Long
Papers)",
year = "2018",
publisher = "Association for Computational Linguistics",
pages = "1112--1122",
location = "New Orleans, Louisiana",
url = "http://aclweb.org/anthology/N18-1101"
}