Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

xquad

  • Deskripsi :

XQuAD (Set Data Jawaban Pertanyaan Lintas Bahasa) adalah kumpulan data tolok ukur untuk mengevaluasi performa jawaban pertanyaan lintas bahasa. Dataset terdiri dari subset 240 paragraf dan 1190 pasangan tanya jawab dari set pengembangan SQuAD v1.1 (Rajpurkar et al., 2016) bersama dengan terjemahan profesionalnya ke dalam sepuluh bahasa: Spanyol, Jerman, Yunani, Rusia, Turki , Arab, Vietnam, Thailand, Cina, dan Hindi. Akibatnya, dataset seluruhnya paralel dalam 11 bahasa. Untuk menjalankan XQuAD dalam pengaturan zero-shot default, gunakan pelatihan SQuAD v1.1 dan data validasi di sini: https://www.tensorflow.org/datasets/catalog/squad

Kami juga menyertakan pemisahan "translate-train", "translate-dev", dan "translate-test" untuk setiap bahasa non-Inggris dari XTREME (Hu et al., 2020). Ini dapat digunakan untuk menjalankan XQuAD di setelan "translate-train" atau "translate-test".

FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
@article{Artetxe:etal:2019,
      author    = {Mikel Artetxe and Sebastian Ruder and Dani Yogatama},
      title     = {On the cross-lingual transferability of monolingual representations},
      journal   = {CoRR},
      volume    = {abs/1910.11856},
      year      = {2019},
      archivePrefix = {arXiv},
      eprint    = {1910.11856}
}

xquad / ar (konfigurasi default)

  • Deskripsi konfigurasi : Pembagian pengujian XQuAD 'ar', dengan pemisahan terjemahan-train / translate-dev / translate-test yang diterjemahkan mesin dari XTREME (Hu et al., 2020).

  • Ukuran unduhan : 420.97 MiB

  • Ukuran 134.78 MiB data : 134.78 MiB

  • Cache otomatis ( dokumentasi ): Ya

  • Split :

Membagi Contoh
'test' 1.190
'translate-dev' 10.541
'translate-test' 1.151
'translate-train' 86.787

xquad / de

  • Deskripsi konfigurasi : Pembagian pengujian 'de' XQuAD, dengan pemisahan terjemahan-train / translate-dev / translate-test yang diterjemahkan mesin dari XTREME (Hu et al., 2020).

  • Ukuran unduhan : 127.04 MiB

  • Ukuran 98.75 MiB data : 98.75 MiB

  • Cache otomatis ( dokumentasi ): Ya

  • Split :

Membagi Contoh
'test' 1.190
'translate-dev' 10.371
'translate-test' 1.168
'translate-train' 82.603

xquad / el

  • Deskripsi konfigurasi : Pembagian uji 'el' XQuAD, dengan pemisahan terjemahan-train / translate-dev / translate-test yang diterjemahkan mesin dari XTREME (Hu et al., 2020).

  • Ukuran download : 499.40 MiB

  • Ukuran 157.85 MiB data : 157.85 MiB

  • Cache otomatis ( dokumentasi ): Ya (test, translate-dev, translate-test), Hanya jika shuffle_files=False (translate-train)

  • Split :

Membagi Contoh
'test' 1.190
'translate-dev' 10.100
'translate-test' 1.182
'translate-train' 79.946

xquad / es

  • Deskripsi konfigurasi : Pembagian pengujian XQuAD 'es', dengan pemisahan terjemahan-train / translate-dev / translate-test yang diterjemahkan mesin dari XTREME (Hu et al., 2020).

  • Ukuran unduhan : 138.41 MiB

  • Ukuran 104.91 MiB data : 104.91 MiB

  • Cache otomatis ( dokumentasi ): Ya

  • Split :

Membagi Contoh
'test' 1.190
'translate-dev' 10.566
'translate-test' 1.188
'translate-train' 87.488

xquad / hai

  • Deskripsi konfigurasi : Pembagian uji 'hi' XQuAD, dengan pemisahan terjemahan-train / translate-dev / translate-test yang diterjemahkan mesin dari XTREME (Hu et al., 2020).

  • Ukuran unduhan : 472.23 MiB

  • Ukuran 207.80 MiB data : 207.80 MiB

  • Cache otomatis ( dokumentasi ): Ya (test, translate-dev, translate-test), Hanya jika shuffle_files=False (translate-train)

  • Split :

Membagi Contoh
'test' 1.190
'translate-dev' 10.536
'translate-test' 1.184
'translate-train' 85.804

xquad / ru

  • Deskripsi konfigurasi : Pembagian uji 'ru' XQuAD, dengan pemisahan terjemahan-train / translate-dev / translate-test yang diterjemahkan mesin dari XTREME (Hu et al., 2020).

  • Ukuran unduhan : 513.80 MiB

  • Ukuran 159.33 MiB data : 159.33 MiB

  • Cache otomatis ( dokumentasi ): Ya (test, translate-dev, translate-test), Hanya jika shuffle_files=False (translate-train)

  • Split :

Membagi Contoh
'test' 1.190
'translate-dev' 10.469
'translate-test' 1.190
'translate-train' 84.869

xquad / th

  • Deskripsi konfigurasi : Pembagian pengujian XQuAD 'th', dengan pemisahan terjemahan-train / translate-dev / translate-test yang diterjemahkan mesin dari XTREME (Hu et al., 2020).

  • Ukuran unduhan : 461.54 MiB

  • Ukuran 199.52 MiB data : 199.52 MiB

  • Cache otomatis ( dokumentasi ): Ya (test, translate-dev, translate-test), Hanya jika shuffle_files=False (translate-train)

  • Split :

Membagi Contoh
'test' 1.190
'translate-dev' 10.516
'translate-test' 1.157
'translate-train' 85.846

xquad / tr

  • Deskripsi konfigurasi : Pembagian pengujian 'tr' XQuAD, dengan pemisahan terjemahan-train / translate-dev / translate-test yang diterjemahkan mesin dari XTREME (Hu et al., 2020).

  • Ukuran unduhan : 151.08 MiB

  • Ukuran 97.51 MiB data : 97.51 MiB

  • Cache otomatis ( dokumentasi ): Ya

  • Split :

Membagi Contoh
'test' 1.190
'translate-dev' 10.535
'translate-test' 1.112
'translate-train' 86.511

xquad / vi

  • Deskripsi konfigurasi : Pembagian pengujian XQuAD 'vi', dengan pemisahan terjemahan-train / translate-dev / translate-test yang diterjemahkan mesin dari XTREME (Hu et al., 2020).

  • Ukuran unduhan : 218.09 MiB

  • Ukuran 119.98 MiB data : 119.98 MiB

  • Cache otomatis ( dokumentasi ): Ya

  • Split :

Membagi Contoh
'test' 1.190
'translate-dev' 10.555
'translate-test' 1.178
'translate-train' 87.187

xquad / zh

  • Deskripsi konfigurasi : Pembagian pengujian XQuAD 'zh', dengan pemisahan terjemahan-train / translate-dev / translate-test yang diterjemahkan mesin dari XTREME (Hu et al., 2020).

  • Ukuran unduhan : 174.57 MiB

  • Ukuran 80.74 MiB data : 80.74 MiB

  • Cache otomatis ( dokumentasi ): Ya

  • Split :

Membagi Contoh
'test' 1.190
'translate-dev' 10.475
'translate-test' 1.186
'translate-train' 85.700

xquad / en

  • Deskripsi konfigurasi : pemisahan uji XQuAD 'en'.

  • Ukuran unduhan : 595.10 KiB

  • Ukuran set data : 1.19 MiB

  • Cache otomatis ( dokumentasi ): Ya

  • Split :

Membagi Contoh
'test' 1.190