- Açıklama :
statmt.org'daki verilere dayalı olarak veri kümesini çevirin.
Sürümler, birden çok veri kaynağının bir kombinasyonunu kullanan farklı yıllar için mevcuttur. wmt_translate
tabanı, özel bir tfds.translate.wmt.WmtConfig
oluşturarak kendi veri/dil çiftinizi seçmek için kendi yapılandırmanızı oluşturmanıza olanak tanır.
config = tfds.translate.wmt.WmtConfig(
version="0.0.1",
language_pair=("fr", "de"),
subsets={
tfds.Split.TRAIN: ["commoncrawl_frde"],
tfds.Split.VALIDATION: ["euelections_dev2019"],
},
)
builder = tfds.builder("wmt_translate", config=config)
Ana sayfa : http://www.statmt.org/wmt16/translation-task.html
Kaynak kodu :
tfds.translate.Wmt16Translate
Sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
Veri kümesi boyutu :
Unknown size
Manuel indirme talimatları : Bu veri kümesi, kaynak verileri download_config.manual_dir içine manuel olarak
download_config.manual_dir
gerektirir (varsayılanı~/tensorflow_datasets/downloads/manual/
):
Buradaki wmt yapılandırmalarından bazıları manuel olarak indirilmesini gerektirir. İndirilmesi gereken tam yolu (ve dosya adını) görmek için lütfen wmt.py'ye bakın.Otomatik önbelleğe alındı ( belgeler ): Bilinmiyor
Şekil ( tfds.show_examples ): Desteklenmez.
Örnekler ( tfds.as_dataframe ): Eksik.
alıntı :
@InProceedings{bojar-EtAl:2016:WMT1,
author = {Bojar, Ond
{r}ej and Chatterjee, Rajen and Federmann, Christian and Graham, Yvette and Haddow, Barry and Huck, Matthias and Jimeno Yepes, Antonio and Koehn, Philipp and Logacheva, Varvara and Monz, Christof and Negri, Matteo and Neveol, Aurelie and Neves, Mariana and Popel, Martin and Post, Matt and Rubino, Raphael and Scarton, Carolina and Specia, Lucia and Turchi, Marco and Verspoor, Karin and Zampieri, Marcos},
title = {Findings of the 2016 Conference on Machine Translation},
booktitle = {Proceedings of the First Conference on Machine Translation},
month = {August},
year = {2016},
address = {Berlin, Germany},
publisher = {Association for Computational Linguistics},
pages = {131--198},
url = {http://www.aclweb.org/anthology/W/W16/W16-2301}
}
wmt16_translate/cs-en (varsayılan yapılandırma)
Yapılandırma açıklaması : WMT 2016 cs-en çeviri görevi veri kümesi.
İndirme boyutu :
1.57 GiB
Bölmeler :
Bölmek | Örnekler |
---|---|
'test' | 2.999 |
'train' | 52.335.651 |
'validation' | 2.656 |
- Özellik yapısı :
Translation({
'cs': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
Tercüme | ||||
cs | Metin | tf.string | ||
tr | Metin | tf.string |
- Denetlenen anahtarlar (bkz
as_supervised
doc ):('cs', 'en')
wmt16_translate/de-en
Yapılandırma açıklaması : WMT 2016 de-en çeviri görevi veri kümesi.
İndirme boyutu :
1.57 GiB
Bölmeler :
Bölmek | Örnekler |
---|---|
'test' | 2.999 |
'train' | 4,548,885 |
'validation' | 2.169 |
- Özellik yapısı :
Translation({
'de': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
Tercüme | ||||
de | Metin | tf.string | ||
tr | Metin | tf.string |
- Denetlenen anahtarlar (bkz
as_supervised
doc ):('de', 'en')
wmt16_translate/fi-tr
Yapılandırma açıklaması : WMT 2016 fi-en çeviri görevi veri kümesi.
İndirme boyutu :
260.51 MiB
Bölmeler :
Bölmek | Örnekler |
---|---|
'test' | 6.000 |
'train' | 2.073.394 |
'validation' | 1.370 |
- Özellik yapısı :
Translation({
'en': Text(shape=(), dtype=tf.string),
'fi': Text(shape=(), dtype=tf.string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
Tercüme | ||||
tr | Metin | tf.string | ||
fi | Metin | tf.string |
- Denetimli anahtarlar (bkz
as_supervised
doc ):('fi', 'en')
wmt16_translate/ro-tr
Yapılandırma açıklaması : WMT 2016 ro-en çeviri görevi veri kümesi.
İndirme boyutu :
273.83 MiB
Bölmeler :
Bölmek | Örnekler |
---|---|
'test' | 1999 |
'train' | 610.320 |
'validation' | 1999 |
- Özellik yapısı :
Translation({
'en': Text(shape=(), dtype=tf.string),
'ro': Text(shape=(), dtype=tf.string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
Tercüme | ||||
tr | Metin | tf.string | ||
ro | Metin | tf.string |
- Denetlenen anahtarlar (bkz
as_supervised
doc ):('ro', 'en')
wmt16_translate/ru-tr
Yapılandırma açıklaması : WMT 2016 ru-en çeviri görevi veri kümesi.
İndirme boyutu :
993.38 MiB
Bölmeler :
Bölmek | Örnekler |
---|---|
'test' | 2.998 |
'train' | 2.516.162 |
'validation' | 2.818 |
- Özellik yapısı :
Translation({
'en': Text(shape=(), dtype=tf.string),
'ru': Text(shape=(), dtype=tf.string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
Tercüme | ||||
tr | Metin | tf.string | ||
ru | Metin | tf.string |
- Denetimli anahtarlar (bkz
as_supervised
doc ):('ru', 'en')
wmt16_translate/tr-tr
Yapılandırma açıklaması : WMT 2016 tr-en çeviri görevi veri kümesi.
İndirme boyutu :
59.32 MiB
Bölmeler :
Bölmek | Örnekler |
---|---|
'test' | 3.000 |
'train' | 205.756 |
'validation' | 1,001 |
- Özellik yapısı :
Translation({
'en': Text(shape=(), dtype=tf.string),
'tr': Text(shape=(), dtype=tf.string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
Tercüme | ||||
tr | Metin | tf.string | ||
tr | Metin | tf.string |
- Denetimli anahtarlar (bkz
as_supervised
doc ):('tr', 'en')