لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

ملقا

  • الوصف :

MLQA (مجموعة بيانات الإجابة على الأسئلة متعددة اللغات) هي مجموعة بيانات معيارية لتقييم أداء الإجابة على الأسئلة متعددة اللغات. تتكون مجموعة البيانات من 7 لغات: العربية ، الألمانية ، الإسبانية ، الإنجليزية ، الهندية ، الفيتنامية ، الصينية.

FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa / ar (التكوين الافتراضي)

  • وصف التكوين : MLQA 'ar' dev and test splits.

  • حجم مجموعة البيانات : 9.27 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 5335
'validation' 517

ملقا / دي

  • وصف التكوين : MLQA 'de' dev and test splits.

  • حجم مجموعة البيانات : 5.06 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 4517
'validation' 512

ملقا / ar

  • وصف التكوين : MLQA 'en' dev and test splits.

  • حجم مجموعة البيانات : 15.72 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.590
'validation' 1148

ملقا / ع

  • وصف التكوين : تقسيمات تطوير واختبار MLQA.

  • حجم مجموعة البيانات : 5.09 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 5253
'validation' 500

ملقا / مرحبا

  • وصف التكوين : MLQA 'hi' dev and test splits.

  • حجم مجموعة البيانات : 12.83 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 4918
'validation' 507

ملقا / السادس

  • وصف التكوين : MLQA 'vi' dev and test splits.

  • حجم مجموعة البيانات : 8.77 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 5،495
'validation' 511

ملقا / زه

  • وصف التكوين : MLQA 'zh' dev and test splits.

  • حجم مجموعة البيانات : 5.13 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 5137
'validation' 504