xtreme_pawsx

  • Deskripsi :

Kumpulan data ini berisi terjemahan mesin dari data pelatihan PAWS bahasa Inggris. Terjemahan disediakan oleh tolok ukur XTREME dan mencakup bahasa-bahasa berikut:

  • Perancis
  • Orang Spanyol
  • Jerman
  • Cina
  • Jepang
  • Korea

Untuk perincian lebih lanjut tentang PAWS, lihat makalah: PAWS: Paraphrase Adversaries from Word Scrambling di https://arxiv.org/abs/1904.01130 dan PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification di https://arxiv. org/abs/1908.11828

Untuk perincian terkait XTREME, silakan merujuk ke: XTREME: Tolok Ukur Multi-tugas Multibahasa Masif untuk Mengevaluasi Generalisasi Lintas Bahasa di https://arxiv.org/abs/2003.11080

FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'sentence1': Text(shape=(), dtype=string),
    'sentence2': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
label LabelKelas int64
kalimat1 Teks rangkaian
kalimat2 Teks rangkaian
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}

xtreme_pawsx/de (konfigurasi default)

  • Deskripsi konfigurasi : Diterjemahkan ke de

  • Ukuran unduhan : 22.34 MiB

  • Ukuran dataset : 14.19 MiB

  • Perpecahan :

Membelah Contoh
'train' 49.340

xtreme_pawsx/es

  • Deskripsi konfigurasi : Diterjemahkan ke es

  • Ukuran unduhan : 22.27 MiB

  • Ukuran dataset : 14.09 MiB

  • Perpecahan :

Membelah Contoh
'train' 49.244

xtreme_pawsx/fr

  • Deskripsi konfigurasi : Diterjemahkan ke fr

  • Ukuran unduhan : 22.70 MiB

  • Ukuran dataset : 14.53 MiB

  • Perpecahan :

Membelah Contoh
'train' 49.208

xtreme_pawsx/ja

  • Deskripsi konfigurasi : Diterjemahkan ke ja

  • Ukuran unduhan : 25.12 MiB

  • Ukuran dataset : 16.98 MiB

  • Perpecahan :

Membelah Contoh
'train' 49.086

xtreme_pawsx/ko

  • Deskripsi konfigurasi : Diterjemahkan ke ko

  • Ukuran unduhan : 22.99 MiB

  • Ukuran dataset : 14.86 MiB

  • Perpecahan :

Membelah Contoh
'train' 49.298

xtreme_pawsx/zh

  • Deskripsi konfigurasi : Diterjemahkan ke zh

  • Ukuran unduhan : 21.45 MiB

  • Ukuran dataset : 13.21 MiB

  • Perpecahan :

Membelah Contoh
'train' 49.149