ırk

  • Açıklama :

Race, 28.000'den fazla pasaj ve yaklaşık 100.000 soru içeren büyük ölçekli bir okuduğunu anlama veri setidir. Veri seti, ortaokul ve lise öğrencileri için tasarlanmış Çin'deki İngilizce sınavlarından toplanmıştır. Veri seti, makine kavraması için eğitim ve test setleri olarak kullanılabilir.

  • Yapılandırma açıklaması : RACE veri kümesi için oluşturucu yapılandırması.

  • Ana sayfa : https://www.cs.cmu.edu/~glai1/data/race/

  • Kaynak kodu : tfds.text.race.Race

  • Sürümler :

    • 1.0.0 : İlk sürüm.
    • 2.0.0 (varsayılan): Örnek kimliği ekleyin.
  • İndirme boyutu : 24.26 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Özellikler :

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'article': Text(shape=(), dtype=tf.string),
    'example_id': Text(shape=(), dtype=tf.string),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

yarış/yüksek (varsayılan yapılandırma)

  • Veri kümesi boyutu : 52.39 MiB

  • Bölmeler :

Bölmek Örnekler
'dev' 1.021
'test' 1.045
'train' 18,728

yarış/orta

  • Veri kümesi boyutu : 12.51 MiB

  • Bölmeler :

Bölmek Örnekler
'dev' 368
'test' 362
'train' 6.409