bilim_kuyruk

  • Açıklama :

SciTail veri seti, çoktan seçmeli bilim sınavlarından ve web cümlelerinden oluşturulmuş bir gereklilik veri setidir. Her soru ve doğru cevap seçimi, hipotezi oluşturmak için iddialı bir ifadeye dönüştürülür. Bilgi alımı, web cümlelerinden oluşan geniş bir metin bütününden ilgili metni elde etmek için kullanılır ve bu cümleler bir öncül P olarak kullanılır. Bu tür öncül-hipotez çiftinin açıklamaları, sırasıyla destekler (içerir) veya değil (nötr) olarak kitle kaynaklıdır. SciTail veri kümesini oluşturmak için. Veri kümesi, etiket içeren 10.101 örnek ve nötr etiketli 16.925 örnek içeren 27.026 örnek içermektedir.

Bölmek Örnekler
'test' 2.126
'train' 23.097
'validation' 1.304
  • Özellik yapısı :
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'premise': Text(shape=(), dtype=tf.string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
hipotez Metin tf.string
etiket sınıf etiketi tf.int64
Öncül Metin tf.string
  • alıntı :
@inproceedings{khot2018scitail,
    title={Scitail: A textual entailment dataset from science question answering},
    author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
    booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
    url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
    year={2018}
}