doc_nli

Açıklama :

DocNLI, belge düzeyinde doğal dil çıkarımı (NLI) için büyük ölçekli bir veri kümesidir. DocNLI, çok çeşitli NLP sorunlarından dönüştürülür ve birden çok metin türünü kapsar. Önermeler her zaman belge ayrıntı düzeyinde kalırken, hipotezlerin uzunluğu tek bir cümleden yüzlerce kelimelik pasajlara kadar değişir. Mevcut bazı cümle düzeyinde NLI veri kümelerinin aksine, DocNLI oldukça sınırlı eserlere sahiptir.

Ek Belgeler : Belgeleri Keşfedin
Ana Sayfa : https://github.com/salesforce/DocNLI/
Kaynak kodu : tfds.text.docnli.DocNLI
sürümler :
- 1.0.0 (varsayılan): İlk sürüm.
İndirme boyutu : 313.89 MiB
Veri kümesi boyutu : 3.07 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :

Bölmek	örnekler
`'test'`	267.086
`'train'`	942.314
`'validation'`	234.258

Özellik yapısı :

FeaturesDict({
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'premise': Text(shape=(), dtype=string),
})

Özellik belgeleri :

Özellik	Sınıf	Dtipi
	ÖzelliklerDict
hipotez	Metin	sicim
etiket	SınıfEtiketi	int64
Öncül	Metin	sicim

Denetlenen anahtarlar (Bkz as_supervised doc ): None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):

Alıntı :

@inproceedings{yin-etal-2021-docnli,
    title={DocNLI: A Large-scale Dataset for Document-level Natural Language Inference},
    author={Wenpeng Yin and Dragomir Radev and Caiming Xiong},
    booktitle = "Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021",
    month = aug,
    year = "2021",
    address = "Bangkok, Thailand",
    publisher = "Association for Computational Linguistics",
}

doc_nli Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.

doc_nli