Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

para_crawl

  • Deskripsi :

Korpora Paralel Skala Web untuk Bahasa Resmi Eropa.

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl / enbg (konfigurasi default)

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke bg.

  • Ukuran unduhan : 98.94 MiB

  • Ukuran 362.46 MiB data : 362.46 MiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 1.039.885
  • Fitur :
Translation({
    'bg': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / encs

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke cs.

  • Ukuran unduhan : 187.31 MiB

  • Ukuran 666.34 MiB data : 666.34 MiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 2.981.949
  • Fitur :
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enda

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke da.

  • Ukuran unduhan : 174.34 MiB

  • Ukuran 619.77 MiB data : 619.77 MiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 2.414.895
  • Fitur :
Translation({
    'da': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / ende

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke de.

  • Ukuran unduhan : 1.22 GiB

  • Ukuran kumpulan data : 4.04 GiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 16.264.448
  • Fitur :
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enel

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke el.

  • Ukuran unduhan : 184.59 MiB

  • Ukuran 698.75 MiB data : 698.75 MiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 1.985.233
  • Fitur :
Translation({
    'el': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enes

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke es.

  • Ukuran unduhan : 1.82 GiB

  • Ukuran set data : 6.23 GiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 21.987.267
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'es': Text(shape=(), dtype=tf.string),
})

para_crawl / enet

  • Deskripsi konfigurasi : Dataset terjemahan dari bahasa Inggris ke et.

  • Ukuran unduhan : 66.91 MiB

  • Ukuran 209.16 MiB data : 209.16 MiB

  • Cache otomatis ( dokumentasi ): Hanya jika shuffle_files=False (latih)

  • Split :

Membagi Contoh
'train' 853.422
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'et': Text(shape=(), dtype=tf.string),
})

para_crawl / enfi

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke fi.

  • Ukuran unduhan : 151.83 MiB

  • Ukuran 543.85 MiB data : 543.85 MiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 2.156.069
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

para_crawl / enfr

  • Deskripsi konfigurasi : Dataset terjemahan dari bahasa Inggris ke fr.

  • Ukuran unduhan : 2.63 GiB

  • Ukuran set data : 9.04 GiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 31.374.161
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fr': Text(shape=(), dtype=tf.string),
})
.dll

para_crawl / enga

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke ga.

  • Ukuran unduhan : 28.03 MiB

  • Ukuran 107.09 MiB data : 107.09 MiB

  • Cache otomatis ( dokumentasi ): Ya

  • Split :

Membagi Contoh
'train' 357.399
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ga': Text(shape=(), dtype=tf.string),
})

para_crawl / enhr

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke jam.

  • Ukuran unduhan : 80.97 MiB

  • Ukuran 256.37 MiB data : 256.37 MiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 1.002.053
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hr': Text(shape=(), dtype=tf.string),
})

para_crawl / enhu

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke bahasa hu.

  • Ukuran unduhan : 114.24 MiB

  • Ukuran 421.40 MiB data : 421.40 MiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 1.901.342
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hu': Text(shape=(), dtype=tf.string),
})

para_crawl / enit

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke bahasa itu.

  • Ukuran unduhan : 1017.30 MiB

  • Ukuran set data : 3.36 GiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 12.162.239
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'it': Text(shape=(), dtype=tf.string),
})

para_crawl / enlt

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke lt.

  • Ukuran unduhan : 63.28 MiB

  • Ukuran 204.70 MiB data : 204.70 MiB

  • Cache otomatis ( dokumentasi ): Hanya jika shuffle_files=False (latih)

  • Split :

Membagi Contoh
'train' 844.643
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lt': Text(shape=(), dtype=tf.string),
})

para_crawl / enlv

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke lv.

  • Ukuran unduhan : 45.17 MiB

  • Ukuran 147.09 MiB data : 147.09 MiB

  • Cache otomatis ( dokumentasi ): Hanya jika shuffle_files=False (latih)

  • Split :

Membagi Contoh
'train' 553.060
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lv': Text(shape=(), dtype=tf.string),
})

para_crawl / enmt

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke mt.

  • Ukuran unduhan : 18.15 MiB

  • Ukuran 54.36 MiB data : 54.36 MiB

  • Cache otomatis ( dokumentasi ): Ya

  • Split :

Membagi Contoh
'train' 195.502
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'mt': Text(shape=(), dtype=tf.string),
})

para_crawl / ennl

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke nl.

  • Ukuran unduhan : 400.63 MiB

  • Ukuran set data : 1.40 GiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 5.659.268
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'nl': Text(shape=(), dtype=tf.string),
})

para_crawl / enpl

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke bahasa Inggris.

  • Ukuran download : 257.90 MiB

  • Ukuran 885.63 MiB data : 885.63 MiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 3.503.276
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pl': Text(shape=(), dtype=tf.string),
})

para_crawl / enpt

  • Deskripsi konfigurasi : Dataset terjemahan dari bahasa Inggris ke pt.

  • Ukuran unduhan : 608.62 MiB

  • Ukuran set data : 2.05 GiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 8.141.940
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

para_crawl / enro

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke ro.

  • Ukuran unduhan : 153.24 MiB

  • Ukuran 534.34 MiB data : 534.34 MiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 1.952.043
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ro': Text(shape=(), dtype=tf.string),
})

para_crawl / ensk

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke sk.

  • Ukuran unduhan : 96.61 MiB

  • Ukuran 352.91 MiB data : 352.91 MiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 1.591.831
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sk': Text(shape=(), dtype=tf.string),
})

para_crawl / ensl

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke sl.

  • Ukuran unduhan : 62.02 MiB

  • Ukuran 187.66 MiB data : 187.66 MiB

  • Cache otomatis ( dokumentasi ): Hanya jika shuffle_files=False (latih)

  • Split :

Membagi Contoh
'train' 660.161
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sl': Text(shape=(), dtype=tf.string),
})

para_crawl / ensv

  • Deskripsi konfigurasi : Kumpulan data terjemahan dari bahasa Inggris ke sv.

  • Ukuran unduhan : 262.76 MiB

  • Ukuran 905.72 MiB data : 905.72 MiB

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'train' 3.476.729
  • Fitur :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sv': Text(shape=(), dtype=tf.string),
})