dörtlü

  • Açıklama :

XQuAD (Çapraz Dilde Soru Yanıtlama Veri Kümesi), diller arası soru yanıtlama performansını değerlendirmek için bir kıyaslama veri kümesidir. Veri seti, SQuAD v1.1 (Rajpurkar ve diğerleri, 2016) geliştirme setinden 240 paragraf ve 1190 soru-cevap çifti ile birlikte on dile profesyonel çevirilerinden oluşur: İspanyolca, Almanca, Yunanca, Rusça, Türkçe , Arapça, Vietnamca, Tayca, Çince ve Hintçe. Sonuç olarak, veri seti 11 dilde tamamen paraleldir. XQuAD'ı varsayılan sıfır atış ayarında çalıştırmak için burada SQuAD v1.1 eğitim ve doğrulama verilerini kullanın: https://www.tensorflow.org/datasets/catalog/squad

Ayrıca XTREME'den İngilizce olmayan her dil için "translate-train", "translate-dev" ve "translate-test" bölümlerini de dahil ediyoruz (Hu ve diğerleri, 2020). Bunlar, "translate-train" veya "translate-test" ayarlarında XQuAD'ı çalıştırmak için kullanılabilir.

  • Ana sayfa : https://github.com/deepmind/xquad

  • Kaynak kodu : tfds.question_answering.Xquad

  • Sürümler :

    • 3.0.0 (varsayılan): Bağlamdaki boşlukların kaldırılması nedeniyle yanıt aralıklarının yanlış hizalandığı birkaç örnekle ilgili sorunu düzeltir. Bu değişiklik, test örneklerinin kabaca %14'ünü etkiler.
  • Özellikler :

FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
@article{Artetxe:etal:2019,
      author    = {Mikel Artetxe and Sebastian Ruder and Dani Yogatama},
      title     = {On the cross-lingual transferability of monolingual representations},
      journal   = {CoRR},
      volume    = {abs/1910.11856},
      year      = {2019},
      archivePrefix = {arXiv},
      eprint    = {1910.11856}
}

xquad/ar (varsayılan yapılandırma)

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölmeleriyle XQuAD 'ar' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 420.97 MiB

  • Veri kümesi boyutu : 134.83 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölmeler :

Bölmek Örnekler
'test' 1,190
'translate-dev' 10.541
'translate-test' 1.151
'translate-train' 86.787

xquad/de

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'de' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 127.04 MiB

  • Veri kümesi boyutu : 98.80 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölmeler :

Bölmek Örnekler
'test' 1,190
'translate-dev' 10.371
'translate-test' 1,168
'translate-train' 82.603

xquad/el

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'el' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 499.40 MiB

  • Veri kümesi boyutu : 157.90 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet (test, translate-dev, translate-test), Yalnızca shuffle_files=False (translate-train) olduğunda

  • Bölmeler :

Bölmek Örnekler
'test' 1,190
'translate-dev' 10,100
'translate-test' 1.182
'translate-train' 79.946

xquad/es

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'es' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 138.41 MiB

  • Veri kümesi boyutu : 104.96 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölmeler :

Bölmek Örnekler
'test' 1,190
'translate-dev' 10.566
'translate-test' 1.188
'translate-train' 87.488

xquad/merhaba

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'merhaba' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 472.23 MiB

  • Veri kümesi boyutu : 207.85 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet (test, translate-dev, translate-test), Yalnızca shuffle_files=False (translate-train) olduğunda

  • Bölmeler :

Bölmek Örnekler
'test' 1,190
'translate-dev' 10.536
'translate-test' 1.184
'translate-train' 85.804

xquad/ru

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'ru' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 513.80 MiB

  • Veri kümesi boyutu : 159.38 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet (test, translate-dev, translate-test), Yalnızca shuffle_files=False (translate-train) olduğunda

  • Bölmeler :

Bölmek Örnekler
'test' 1,190
'translate-dev' 10.469
'translate-test' 1,190
'translate-train' 84.869

xquad/th

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'th' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 461.54 MiB

  • Veri kümesi boyutu : 199.57 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet (test, translate-dev, translate-test), Yalnızca shuffle_files=False (translate-train) olduğunda

  • Bölmeler :

Bölmek Örnekler
'test' 1,190
'translate-dev' 10.516
'translate-test' 1157
'translate-train' 85.846

xquad/tr

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'tr' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 151.08 MiB

  • Veri kümesi boyutu : 97.56 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölmeler :

Bölmek Örnekler
'test' 1,190
'translate-dev' 10.535
'translate-test' 1112
'translate-train' 86.511

xquad/vi

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'vi' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 218.09 MiB

  • Veri kümesi boyutu : 120.03 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölmeler :

Bölmek Örnekler
'test' 1,190
'translate-dev' 10.555
'translate-test' 1.178
'translate-train' 87.187

xquad/zh

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'zh' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 174.57 MiB

  • Veri kümesi boyutu : 80.79 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölmeler :

Bölmek Örnekler
'test' 1,190
'translate-dev' 10.475
'translate-test' 1.186
'translate-train' 85.700

xquad/tr

  • Yapılandırma açıklaması : XQuAD 'en' test bölümü.

  • İndirme boyutu : 595.10 KiB

  • Veri kümesi boyutu : 1.19 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölmeler :

Bölmek Örnekler
'test' 1,190