- Deskripsi :
Kumpulan data yang berasal dari transkrip pembicaraan TED untuk membandingkan pasangan bahasa yang serupa di mana satu sumber daya tinggi dan yang lainnya sumber daya rendah.
Kode sumber :
tfds.translate.TedHrlrTranslate
Versi :
-
1.0.0
(default): API split baru ( https://tensorflow.org/datasets/splits )
-
Ukuran unduhan :
124.94 MiB
Ukuran kumpulan data :
Unknown size
Cache otomatis ( dokumentasi ): Tidak diketahui
Kutipan :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
- Gambar ( tfds.show_examples ): Tidak didukung.
ted_hrlr_translate / az_to_en (konfigurasi default)
Deskripsi konfigurasi : Kumpulan data terjemahan dari az ke en dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 903 |
'train' | 5.946 |
'validation' | 671 |
- Fitur :
Translation({
'az': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('az', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / aztr_to_en
Deskripsi konfigurasi : Kumpulan data terjemahan dari az_tr ke en dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 903 |
'train' | 188.396 |
'validation' | 671 |
- Fitur :
Translation({
'az_tr': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('az_tr', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / be_to_en
Deskripsi konfigurasi : Kumpulan data terjemahan dari be menjadi en dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 664 |
'train' | 4.509 |
'validation' | 248 |
- Fitur :
Translation({
'be': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
.dllKunci yang diawasi (Lihat
as_supervised
doc ):('be', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / beru_to_en
Deskripsi konfigurasi : Kumpulan data terjemahan dari be_ru ke en dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 664 |
'train' | 212.614 |
'validation' | 248 |
- Fitur :
Translation({
'be_ru': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
.dllKunci yang diawasi (Lihat
as_supervised
doc ):('be_ru', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / es_to_pt
Deskripsi konfigurasi : Kumpulan data terjemahan dari es ke pt dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 1.763 |
'train' | 44.938 |
'validation' | 1.016 |
- Fitur :
Translation({
'es': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('es', 'pt')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / fr_to_pt
Deskripsi konfigurasi : Kumpulan data terjemahan dari fr ke pt dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 1.494 |
'train' | 43.873 |
'validation' | 1.131 |
- Fitur :
Translation({
'fr': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('fr', 'pt')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / gl_to_en
Deskripsi konfigurasi : Kumpulan data terjemahan dari gl ke en dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 1.007 |
'train' | 10.017 |
'validation' | 682 |
- Fitur :
Translation({
'en': Text(shape=(), dtype=tf.string),
'gl': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('gl', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / glpt_to_en
Deskripsi konfigurasi : Kumpulan data terjemahan dari gl_pt ke en dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 1.007 |
'train' | 61.802 |
'validation' | 682 |
- Fitur :
Translation({
'en': Text(shape=(), dtype=tf.string),
'gl_pt': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('gl_pt', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / he_to_pt
Deskripsi konfigurasi : Dataset terjemahan dari he ke pt dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 1.623 |
'train' | 48.511 |
'validation' | 1.145 |
- Fitur :
Translation({
'he': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('he', 'pt')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / it_to_pt
Deskripsi konfigurasi : Dataset terjemahan dari itu ke pt dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 1.669 |
'train' | 46.259 |
'validation' | 1.162 |
- Fitur :
Translation({
'it': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('it', 'pt')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / pt_to_en
Deskripsi konfigurasi : Dataset terjemahan dari pt ke en dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 1.803 |
'train' | 51.785 |
'validation' | 1.193 |
- Fitur :
Translation({
'en': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('pt', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / ru_to_en
Deskripsi konfigurasi : Kumpulan data terjemahan dari ru ke en dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 5.476 |
'train' | 208.106 |
'validation' | 4.805 |
- Fitur :
Translation({
'en': Text(shape=(), dtype=tf.string),
'ru': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('ru', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / ru_to_pt
Deskripsi konfigurasi : Dataset terjemahan dari ru ke pt dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 1.588 |
'train' | 47.278 |
'validation' | 1.184 |
- Fitur :
Translation({
'pt': Text(shape=(), dtype=tf.string),
'ru': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('ru', 'pt')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate / tr_to_en
Deskripsi konfigurasi : Kumpulan data terjemahan dari tr ke en dalam teks biasa.
Split :
Membagi | Contoh |
---|---|
'test' | 5.029 |
'train' | 182.450 |
'validation' | 4.045 |
- Fitur :
Translation({
'en': Text(shape=(), dtype=tf.string),
'tr': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('tr', 'en')
Contoh ( tfds.as_dataframe ):