لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

العنصر

  • الوصف :

العرق هو مجموعة بيانات واسعة النطاق لفهم القراءة مع أكثر من 28000 مقطع وما يقرب من 100000 سؤال. يتم جمع مجموعة البيانات من اختبارات اللغة الإنجليزية في الصين ، والتي تم تصميمها لطلاب المدارس المتوسطة والثانوية. يمكن تقديم مجموعة البيانات كمجموعات تدريب واختبار لفهم الآلة.

  • وصف التكوين : تكوين Builder لمجموعة بيانات RACE.

  • الصفحة الرئيسية : https://www.cs.cmu.edu/~glai1/data/race/

  • كود المصدر : tfds.text.race.Race

  • إصدارات :

    • 1.0.0 : الإصدار الأولي.
    • 2.0.0 (افتراضي): أضف معرف المثال.
  • حجم التحميل : 24.26 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الميزات :

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'article': Text(shape=(), dtype=tf.string),
    'example_id': Text(shape=(), dtype=tf.string),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

سباق / مرتفع (التكوين الافتراضي)

  • حجم مجموعة البيانات : 52.39 MiB

  • الانقسامات :

انشق، مزق أمثلة
'dev' 1،021
'test' 1045
'train' 18،728

العرق / الوسط

  • حجم مجموعة البيانات : 12.51 MiB

  • الانقسامات :

انشق، مزق أمثلة
'dev' 368
'test' 362
'train' 6409