ted_hrlr_translate

  • Deskripsi :

Kumpulan data yang berasal dari transkrip pembicaraan TED untuk membandingkan pasangan bahasa yang serupa di mana satu sumber daya tinggi dan yang lainnya sumber daya rendah.

@inproceedings{Ye2018WordEmbeddings,
  author  = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
  title   = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
  booktitle = {HLT-NAACL},
  year    = {2018},
  }

ted_hrlr_translate/az_to_en (konfigurasi default)

  • Deskripsi konfigurasi : Dataset terjemahan dari az ke en dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 903
'train' 5.946
'validation' 671
  • Struktur fitur :
Translation({
    'az': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
azi Teks tf.string
id Teks tf.string

ted_hrlr_translate/aztr_to_en

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari az_tr ke en dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 903
'train' 188.396
'validation' 671
  • Struktur fitur :
Translation({
    'az_tr': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
az_tr Teks tf.string
id Teks tf.string

ted_hrlr_translate/be_to_en

  • Deskripsi konfigurasi : Dataset terjemahan dari be ke en dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 664
'train' 4,509
'validation' 248
  • Struktur fitur :
Translation({
    'be': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
menjadi Teks tf.string
id Teks tf.string

ted_hrlr_translate/beru_to_en

  • Deskripsi konfigurasi : Dataset terjemahan dari be_ru ke en dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 664
'train' 212.614
'validation' 248
  • Struktur fitur :
Translation({
    'be_ru': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
be_ru Teks tf.string
id Teks tf.string

ted_hrlr_translate/es_to_pt

  • Deskripsi konfigurasi : Dataset terjemahan dari es ke pt dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 1.763
'train' 44.938
'validation' 1.016
  • Struktur fitur :
Translation({
    'es': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
es Teks tf.string
titik Teks tf.string

ted_hrlr_translate/fr_to_pt

  • Deskripsi konfigurasi : Dataset terjemahan dari fr ke pt dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 1,494
'train' 43.873
'validation' 1,131
  • Struktur fitur :
Translation({
    'fr': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
dari Teks tf.string
titik Teks tf.string

ted_hrlr_translate/gl_to_en

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari gl ke en dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 1.007
'train' 10.017
'validation' 682
  • Struktur fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'gl': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
id Teks tf.string
gl Teks tf.string

ted_hrlr_translate/glpt_to_en

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari gl_pt ke en dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 1.007
'train' 61,802
'validation' 682
  • Struktur fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'gl_pt': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
id Teks tf.string
gl_pt Teks tf.string

ted_hrlr_translate/he_to_pt

  • Deskripsi konfigurasi : Dataset terjemahan dari he ke pt dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 1,623
'train' 48.511
'validation' 1.145
  • Struktur fitur :
Translation({
    'he': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
dia Teks tf.string
titik Teks tf.string

ted_hrlr_translate/it_to_pt

  • Deskripsi konfigurasi : Dataset terjemahan dari itu ke pt dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 1,669
'train' 46.259
'validation' 1.162
  • Struktur fitur :
Translation({
    'it': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
dia Teks tf.string
titik Teks tf.string

ted_hrlr_translate/pt_to_en

  • Deskripsi konfigurasi : Dataset terjemahan dari pt ke en dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 1,803
'train' 51.785
'validation' 1.193
  • Struktur fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
id Teks tf.string
titik Teks tf.string

ted_hrlr_translate/ru_to_en

  • Deskripsi konfigurasi : Dataset terjemahan dari ru ke en dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 5.476
'train' 208.106
'validation' 4.805
  • Struktur fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
id Teks tf.string
ru Teks tf.string

ted_hrlr_translate/ru_to_pt

  • Deskripsi konfigurasi : Dataset terjemahan dari ru ke pt dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 1,588
'train' 47.278
'validation' 1.184
  • Struktur fitur :
Translation({
    'pt': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
titik Teks tf.string
ru Teks tf.string

ted_hrlr_translate/tr_to_en

  • Deskripsi konfigurasi : Dataset terjemahan dari tr ke en dalam teks biasa.

  • Perpecahan :

Membelah Contoh
'test' 5.029
'train' 182.450
'validation' 4.045
  • Struktur fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'tr': Text(shape=(), dtype=tf.string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk tipe D Keterangan
Terjemahan
id Teks tf.string
tr Teks tf.string