גזע

  • תיאור :

Race הוא מערך נתונים רחב של הבנת הנקרא עם יותר מ-28,000 קטעים וכמעט 100,000 שאלות. מערך הנתונים נאסף מבחינות אנגלית בסין, המיועדות לתלמידי חטיבת ביניים ותיכון. ניתן להגיש את מערך הנתונים כמערכי ההדרכה והבדיקה להבנת מכונה.

  • תיאור תצורה : תצורת Builder עבור מערך נתונים של RACE.

  • דף הבית : https://www.cs.cmu.edu/~glai1/data/race/

  • קוד מקור : tfds.text.race.Race

  • גרסאות :

    • 1.0.0 : שחרור ראשוני.
    • 2.0.0 (ברירת מחדל): הוסף את המזהה לדוגמה.
  • גודל הורדה : 24.26 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • תכונות :

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'article': Text(shape=(), dtype=tf.string),
    'example_id': Text(shape=(), dtype=tf.string),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

מירוץ/גבוה (תצורת ברירת מחדל)

  • גודל מערך נתונים : 52.39 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'dev' 1,021
'test' 1,045
'train' 18,728

גזע/אמצע

  • גודל מערך נתונים : 12.51 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'dev' 368
'test' 362
'train' 6,409