- Açıklama :
Race, 28.000'den fazla pasaj ve yaklaşık 100.000 soru içeren büyük ölçekli bir okuduğunu anlama veri setidir. Veri seti, ortaokul ve lise öğrencileri için tasarlanmış Çin'deki İngilizce sınavlarından toplanmıştır. Veri seti, makine kavraması için eğitim ve test setleri olarak kullanılabilir.
Yapılandırma açıklaması : RACE veri kümesi için oluşturucu yapılandırması.
Ana sayfa : https://www.cs.cmu.edu/~glai1/data/race/
Kaynak kodu :
tfds.text.race.Race
Sürümler :
-
1.0.0
: İlk sürüm. -
2.0.0
(varsayılan): Örnek kimliği ekleyin.
-
İndirme boyutu :
24.26 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Özellikler :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=tf.string)),
'article': Text(shape=(), dtype=tf.string),
'example_id': Text(shape=(), dtype=tf.string),
'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
Denetimli anahtarlar (bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmez.
alıntı :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
yarış/yüksek (varsayılan yapılandırma)
Veri kümesi boyutu :
52.39 MiB
Bölmeler :
Bölmek | Örnekler |
---|---|
'dev' | 1.021 |
'test' | 1.045 |
'train' | 18,728 |
- Örnekler ( tfds.as_dataframe ):
yarış/orta
Veri kümesi boyutu :
12.51 MiB
Bölmeler :
Bölmek | Örnekler |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6.409 |
- Örnekler ( tfds.as_dataframe ):