mlqa

  • Açıklama:

MLQA (Çok Dilde Soru Cevaplama Veri Kümesi), çok dilli soru cevaplama performansını değerlendirmek için bir kıyaslama veri kümesidir. Veri seti 7 dilden oluşur: Arapça, Almanca, İspanyolca, İngilizce, Hintçe, Vietnamca, Çince.

FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa/ar (varsayılan yapılandırma)

  • Yapılandırma tanımı: MLQA 'ar' dev ve test böler.

  • Veri kümesi boyutu: 9.27 MiB

  • Splits:

Bölmek Örnekler
'test' 5,335
'validation' 517

mlqa/de

  • Yapılandırma tanımı: MLQA 'de' dev ve test böler.

  • Veri kümesi boyutu: 5.06 MiB

  • Splits:

Bölmek Örnekler
'test' 4,517
'validation' 512

mlqa/tr

  • Yapılandırma tanımı: MLQA 'tr' dev ve test böler.

  • Veri kümesi boyutu: 15.72 MiB

  • Splits:

Bölmek Örnekler
'test' 11.590
'validation' 1,148

mlqa/es

  • Yapılandırma tanımı: MLQA 'es' dev ve test böler.

  • Veri kümesi boyutu: 5.09 MiB

  • Splits:

Bölmek Örnekler
'test' 5,253
'validation' 500

mlqa/merhaba

  • Yapılandırma tanımı: MLQA 'hi' dev ve test böler.

  • Veri kümesi boyutu: 12.83 MiB

  • Splits:

Bölmek Örnekler
'test' 4.918
'validation' 507

mlqa/vi

  • Yapılandırma açıklaması: MLQA vi dev ve test böler.

  • Veri kümesi boyutu: 8.77 MiB

  • Splits:

Bölmek Örnekler
'test' 5.495
'validation' 511

mlqa/zh

  • Yapılandırma tanımı: MLQA 'zh' dev ve test böler.

  • Veri kümesi boyutu: 5.13 MiB

  • Splits:

Bölmek Örnekler
'test' 5,137
'validation' 504