- Açıklama:
Resmi Avrupa Dilleri için Web Ölçekli Parallel Corpora.
Anasayfa: https://paracrawl.eu/releases.html
Kaynak kodu:
tfds.translate.ParaCrawl
sürümleri:
-
1.2.0
(varsayılan): Hayır sürüm notları.
-
Şekil ( tfds.show_examples ): desteklenmez.
Citation:
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (varsayılan yapılandırma)
Yapılandırma tanımı: İngilizceden Çeviri veri kümesi bg için.
İndirme boyutu:
98.94 MiB
Veri kümesi boyutu:
362.46 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 1.039.885 |
- Özellikler:
Translation({
'bg': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'bg')
Örnekler ( tfds.as_dataframe ):
para_crawl/encs
Yapılandırma tanımı: cs İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
187.31 MiB
Veri kümesi boyutu:
666.34 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 2.981.949 |
- Özellikler:
Translation({
'cs': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'cs')
Örnekler ( tfds.as_dataframe ):
para_crawl/enda
Yapılandırma tanımı: da İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
174.34 MiB
Veri kümesi boyutu:
619.77 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 2.414.895 |
- Özellikler:
Translation({
'da': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'da')
Örnekler ( tfds.as_dataframe ):
para_crawl/ende
Yapılandırma tanımı: İngilizceden Çeviri veri kümesi de için.
İndirme boyutu:
1.22 GiB
Veri kümesi boyutu:
4.04 GiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 16.264.448 |
- Özellikler:
Translation({
'de': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'de')
Örnekler ( tfds.as_dataframe ):
para_crawl/enel
Yapılandırma tanımı: el İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
184.59 MiB
Veri kümesi boyutu:
698.75 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 1.985.233 |
- Özellikler:
Translation({
'el': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'el')
Örnekler ( tfds.as_dataframe ):
para_crawl/enes
Yapılandırma tanımı: es İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
1.82 GiB
Veri kümesi boyutu:
6.23 GiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 21.987.267 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'es': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'es')
Örnekler ( tfds.as_dataframe ):
para_crawl/enet
Yapılandırma tanımı: et İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
66.91 MiB
Veri kümesi boyutu:
209.16 MiB
Otomatik önbelleğe ( dokümantasyon ): Yalnızca
shuffle_files=False
(tren)Splits:
Bölmek | Örnekler |
---|---|
'train' | 853.422 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'et': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'et')
Örnekler ( tfds.as_dataframe ):
para_crawl/enfi
Yapılandırma tanımı: fi İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
151.83 MiB
Veri kümesi boyutu:
543.85 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 2.156.069 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'fi': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'fi')
Örnekler ( tfds.as_dataframe ):
para_crawl/enfr
Yapılandırma tanımı: İngilizceden Çeviri veri kümesi fr için.
İndirme boyutu:
2.63 GiB
Veri kümesi boyutu:
9.04 GiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 31.374.161 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'fr': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'fr')
Örnekler ( tfds.as_dataframe ):
para_crawl/enga
Yapılandırma tanımı: ga İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
28.03 MiB
Veri kümesi boyutu:
107.09 MiB
Otomatik önbelleğe ( dokümantasyon ): Evet
Splits:
Bölmek | Örnekler |
---|---|
'train' | 357.399 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'ga': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'ga')
Örnekler ( tfds.as_dataframe ):
para_crawl/enhr
Yapılandırma tanımı: saat İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
80.97 MiB
Veri kümesi boyutu:
256.37 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 1.002.053 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'hr': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'hr')
Örnekler ( tfds.as_dataframe ):
para_crawl/enhu
Yapılandırma tanımı: hu İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
114.24 MiB
Veri kümesi boyutu:
421.40 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 1.901.342 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'hu': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'hu')
Örnekler ( tfds.as_dataframe ):
para_crawl/enit
Yapılandırma tanımı: o İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
1017.30 MiB
Veri kümesi boyutu:
3.36 GiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 12.162.239 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'it': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'it')
Örnekler ( tfds.as_dataframe ):
para_crawl/enlt
Yapılandırma tanımı: İngilizceden Çeviri veri kümesi lt için.
İndirme boyutu:
63.28 MiB
Veri kümesi boyutu:
204.70 MiB
Otomatik önbelleğe ( dokümantasyon ): Yalnızca
shuffle_files=False
(tren)Splits:
Bölmek | Örnekler |
---|---|
'train' | 844.643 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'lt': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (bakınız
as_supervised
doc ):('en', 'lt')
Örnekler ( tfds.as_dataframe ):
para_crawl/enlv
Yapılandırma tanımı: İngilizceden Çeviri veri kümesi lv.
İndirme boyutu:
45.17 MiB
Veri kümesi boyutu:
147.09 MiB
Otomatik önbelleğe ( dokümantasyon ): Yalnızca
shuffle_files=False
(tren)Splits:
Bölmek | Örnekler |
---|---|
'train' | 553.060 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'lv': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'lv')
Örnekler ( tfds.as_dataframe ):
para_crawl/enmt
Yapılandırma tanımı: mt İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
18.15 MiB
Veri kümesi boyutu:
54.36 MiB
Otomatik önbelleğe ( dokümantasyon ): Evet
Splits:
Bölmek | Örnekler |
---|---|
'train' | 195.502 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'mt': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'mt')
Örnekler ( tfds.as_dataframe ):
para_crawl/ennl
Yapılandırma tanımı: İngilizceden Çeviri veri kümesi nl için.
İndirme boyutu:
400.63 MiB
Veri kümesi boyutu:
1.40 GiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 5.659.268 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'nl': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'nl')
Örnekler ( tfds.as_dataframe ):
para_crawl/enpl
Yapılandırma tanımı: İngilizceden Çeviri veri kümesi pl için.
İndirme boyutu:
257.90 MiB
Veri kümesi boyutu:
885.63 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 3.503.276 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'pl': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'pl')
Örnekler ( tfds.as_dataframe ):
para_crawl/enpt
Yapılandırma tanımı: nk İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
608.62 MiB
Veri kümesi boyutu:
2.05 GiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 8.141.940 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'pt')
Örnekler ( tfds.as_dataframe ):
para_crawl/enro
Yapılandırma tanımı: İngilizceden Çeviri veri kümesi ro için.
İndirme boyutu:
153.24 MiB
Veri kümesi boyutu:
534.34 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 1.952.043 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'ro': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'ro')
Örnekler ( tfds.as_dataframe ):
para_crawl/enk
Yapılandırma tanımı: İngilizceden Çeviri veri kümesi sk için.
İndirme boyutu:
96.61 MiB
Veri kümesi boyutu:
352.91 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 1.591.831 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'sk': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'sk')
Örnekler ( tfds.as_dataframe ):
para_crawl/enl
Yapılandırma tanımı: sl İngilizce'den Çeviri veri kümesi.
İndirme boyutu:
62.02 MiB
Veri kümesi boyutu:
187.66 MiB
Otomatik önbelleğe ( dokümantasyon ): Yalnızca
shuffle_files=False
(tren)Splits:
Bölmek | Örnekler |
---|---|
'train' | 660.161 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'sl': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'sl')
Örnekler ( tfds.as_dataframe ):
para_crawl/ensv
Yapılandırma tanımı: İngilizceden Çeviri veri kümesi SV için.
İndirme boyutu:
262.76 MiB
Veri kümesi boyutu:
905.72 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 3.476.729 |
- Özellikler:
Translation({
'en': Text(shape=(), dtype=tf.string),
'sv': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('en', 'sv')
Örnekler ( tfds.as_dataframe ):