para_crawl

  • Açıklama:

Resmi Avrupa Dilleri için Web Ölçekli Parallel Corpora.

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl/enbg (varsayılan yapılandırma)

  • Yapılandırma tanımı: İngilizceden Çeviri veri kümesi bg için.

  • İndirme boyutu: 98.94 MiB

  • Veri kümesi boyutu: 362.46 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 1.039.885
  • Özellikler:
Translation({
    'bg': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/encs

  • Yapılandırma tanımı: cs İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 187.31 MiB

  • Veri kümesi boyutu: 666.34 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 2.981.949
  • Özellikler:
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/enda

  • Yapılandırma tanımı: da İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 174.34 MiB

  • Veri kümesi boyutu: 619.77 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 2.414.895
  • Özellikler:
Translation({
    'da': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/ende

  • Yapılandırma tanımı: İngilizceden Çeviri veri kümesi de için.

  • İndirme boyutu: 1.22 GiB

  • Veri kümesi boyutu: 4.04 GiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 16.264.448
  • Özellikler:
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/enel

  • Yapılandırma tanımı: el İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 184.59 MiB

  • Veri kümesi boyutu: 698.75 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 1.985.233
  • Özellikler:
Translation({
    'el': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/enes

  • Yapılandırma tanımı: es İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 1.82 GiB

  • Veri kümesi boyutu: 6.23 GiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 21.987.267
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'es': Text(shape=(), dtype=tf.string),
})

para_crawl/enet

  • Yapılandırma tanımı: et İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 66.91 MiB

  • Veri kümesi boyutu: 209.16 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Yalnızca shuffle_files=False (tren)

  • Splits:

Bölmek Örnekler
'train' 853.422
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'et': Text(shape=(), dtype=tf.string),
})

para_crawl/enfi

  • Yapılandırma tanımı: fi İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 151.83 MiB

  • Veri kümesi boyutu: 543.85 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 2.156.069
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

para_crawl/enfr

  • Yapılandırma tanımı: İngilizceden Çeviri veri kümesi fr için.

  • İndirme boyutu: 2.63 GiB

  • Veri kümesi boyutu: 9.04 GiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 31.374.161
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fr': Text(shape=(), dtype=tf.string),
})

para_crawl/enga

  • Yapılandırma tanımı: ga İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 28.03 MiB

  • Veri kümesi boyutu: 107.09 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Evet

  • Splits:

Bölmek Örnekler
'train' 357.399
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ga': Text(shape=(), dtype=tf.string),
})

para_crawl/enhr

  • Yapılandırma tanımı: saat İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 80.97 MiB

  • Veri kümesi boyutu: 256.37 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 1.002.053
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hr': Text(shape=(), dtype=tf.string),
})

para_crawl/enhu

  • Yapılandırma tanımı: hu İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 114.24 MiB

  • Veri kümesi boyutu: 421.40 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 1.901.342
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hu': Text(shape=(), dtype=tf.string),
})

para_crawl/enit

  • Yapılandırma tanımı: o İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 1017.30 MiB

  • Veri kümesi boyutu: 3.36 GiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 12.162.239
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'it': Text(shape=(), dtype=tf.string),
})

para_crawl/enlt

  • Yapılandırma tanımı: İngilizceden Çeviri veri kümesi lt için.

  • İndirme boyutu: 63.28 MiB

  • Veri kümesi boyutu: 204.70 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Yalnızca shuffle_files=False (tren)

  • Splits:

Bölmek Örnekler
'train' 844.643
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lt': Text(shape=(), dtype=tf.string),
})

para_crawl/enlv

  • Yapılandırma tanımı: İngilizceden Çeviri veri kümesi lv.

  • İndirme boyutu: 45.17 MiB

  • Veri kümesi boyutu: 147.09 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Yalnızca shuffle_files=False (tren)

  • Splits:

Bölmek Örnekler
'train' 553.060
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lv': Text(shape=(), dtype=tf.string),
})

para_crawl/enmt

  • Yapılandırma tanımı: mt İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 18.15 MiB

  • Veri kümesi boyutu: 54.36 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Evet

  • Splits:

Bölmek Örnekler
'train' 195.502
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'mt': Text(shape=(), dtype=tf.string),
})

para_crawl/ennl

  • Yapılandırma tanımı: İngilizceden Çeviri veri kümesi nl için.

  • İndirme boyutu: 400.63 MiB

  • Veri kümesi boyutu: 1.40 GiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 5.659.268
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'nl': Text(shape=(), dtype=tf.string),
})

para_crawl/enpl

  • Yapılandırma tanımı: İngilizceden Çeviri veri kümesi pl için.

  • İndirme boyutu: 257.90 MiB

  • Veri kümesi boyutu: 885.63 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 3.503.276
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pl': Text(shape=(), dtype=tf.string),
})

para_crawl/enpt

  • Yapılandırma tanımı: nk İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 608.62 MiB

  • Veri kümesi boyutu: 2.05 GiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 8.141.940
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

para_crawl/enro

  • Yapılandırma tanımı: İngilizceden Çeviri veri kümesi ro için.

  • İndirme boyutu: 153.24 MiB

  • Veri kümesi boyutu: 534.34 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 1.952.043
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ro': Text(shape=(), dtype=tf.string),
})

para_crawl/enk

  • Yapılandırma tanımı: İngilizceden Çeviri veri kümesi sk için.

  • İndirme boyutu: 96.61 MiB

  • Veri kümesi boyutu: 352.91 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 1.591.831
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sk': Text(shape=(), dtype=tf.string),
})

para_crawl/enl

  • Yapılandırma tanımı: sl İngilizce'den Çeviri veri kümesi.

  • İndirme boyutu: 62.02 MiB

  • Veri kümesi boyutu: 187.66 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Yalnızca shuffle_files=False (tren)

  • Splits:

Bölmek Örnekler
'train' 660.161
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sl': Text(shape=(), dtype=tf.string),
})

para_crawl/ensv

  • Yapılandırma tanımı: İngilizceden Çeviri veri kümesi SV için.

  • İndirme boyutu: 262.76 MiB

  • Veri kümesi boyutu: 905.72 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Hayır

  • Splits:

Bölmek Örnekler
'train' 3.476.729
  • Özellikler:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sv': Text(shape=(), dtype=tf.string),
})