- Açıklama :
SciTail veri seti, çoktan seçmeli bilim sınavlarından ve web cümlelerinden oluşturulmuş bir gereklilik veri setidir. Her soru ve doğru cevap seçimi, hipotezi oluşturmak için iddialı bir ifadeye dönüştürülür. Bilgi alımı, web cümlelerinden oluşan geniş bir metin bütününden ilgili metni elde etmek için kullanılır ve bu cümleler bir öncül P olarak kullanılır. Bu tür öncül-hipotez çiftinin açıklamaları, sırasıyla destekler (içerir) veya değil (nötr) olarak kitle kaynaklıdır. SciTail veri kümesini oluşturmak için. Veri kümesi, etiket içeren 10.101 örnek ve nötr etiketli 16.925 örnek içeren 27.026 örnek içermektedir.
Ana sayfa : https://allenai.org/data/scitail
Kaynak kodu :
tfds.text.scitail.SciTail
Sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
13.52 MiB
Veri kümesi boyutu :
6.01 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölmeler :
Bölmek | Örnekler |
---|---|
'test' | 2.126 |
'train' | 23.097 |
'validation' | 1.304 |
- Özellik yapısı :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'premise': Text(shape=(), dtype=tf.string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
hipotez | Metin | tf.string | ||
etiket | sınıf etiketi | tf.int64 | ||
Öncül | Metin | tf.string |
Denetimli anahtarlar (bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmez.
Örnekler ( tfds.as_dataframe ):
- alıntı :
@inproceedings{khot2018scitail,
title={Scitail: A textual entailment dataset from science question answering},
author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
year={2018}
}