- תיאור :
Race הוא מערך נתונים רחב של הבנת הנקרא עם יותר מ-28,000 קטעים וכמעט 100,000 שאלות. מערך הנתונים נאסף מבחינות אנגלית בסין, המיועדות לתלמידי חטיבת ביניים ותיכון. ניתן להגיש את מערך הנתונים כמערכי ההדרכה והבדיקה להבנת מכונה.
תיאור תצורה : תצורת Builder עבור מערך נתונים של RACE.
דף הבית : https://www.cs.cmu.edu/~glai1/data/race/
קוד מקור :
tfds.text.race.Race
גרסאות :
-
1.0.0
: שחרור ראשוני. -
2.0.0
(ברירת מחדל): הוסף את המזהה לדוגמה.
-
גודל הורדה :
24.26 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
תכונות :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=tf.string)),
'article': Text(shape=(), dtype=tf.string),
'example_id': Text(shape=(), dtype=tf.string),
'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
מירוץ/גבוה (תצורת ברירת מחדל)
גודל מערך נתונים :
52.39 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'dev' | 1,021 |
'test' | 1,045 |
'train' | 18,728 |
- דוגמאות ( tfds.as_dataframe ):
גזע/אמצע
גודל מערך נתונים :
12.51 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6,409 |
- דוגמאות ( tfds.as_dataframe ):