Эта страница была переведа с помощью Cloud Translation API.
Switch to English

para_crawl

  • Описание :

Параллельные веб-корпуса для официальных европейских языков.

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl / enbg_plain_text (конфигурация по умолчанию)

  • Описание конфигурации : Перевод набора данных с английского на bg, использует кодировщик plain_text.

  • Размер загрузки : 98.94 MiB

  • Сплит :

Трещина Примеры
'train' 1 039 885
  • Особенности :
Translation({
    'bg': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / encs_plain_text

  • Описание конфигурации : Перевод набора данных с английского на cs, использует кодировщик plain_text.

  • Размер загрузки : 187.31 MiB

  • Сплит :

Трещина Примеры
'train' 2 981 949
  • Особенности :
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enda_plain_text

  • Описание конфигурации : перевод набора данных с английского на da, использует кодировщик plain_text.

  • Размер загрузки : 174.34 MiB

  • Сплит :

Трещина Примеры
'train' 2 414 895
  • Особенности :
Translation({
    'da': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / ende_plain_text

  • Описание конфигурации : Перевод набора данных с английского на de, использует кодировщик plain_text.

  • Размер загружаемого файла : 1.22 GiB

  • Сплит :

Трещина Примеры
'train' 16 264 448
  • Особенности :
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enel_plain_text

  • Описание конфигурации : перевод набора данных с английского на el, использует кодировщик plain_text.

  • Размер загрузки : 184.59 MiB

  • Сплит :

Трещина Примеры
'train' 1 985 233
  • Особенности :
Translation({
    'el': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enes_plain_text

  • Описание конфигурации : Перевод набора данных с английского на es, использует кодировщик plain_text.

  • Размер загружаемого файла : 1.82 GiB

  • Сплит :

Трещина Примеры
'train' 21 987 267
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'es': Text(shape=(), dtype=tf.string),
})

para_crawl / enet_plain_text

  • Описание конфигурации : перевод набора данных с английского на et, использует кодировщик plain_text.

  • Размер загрузки : 66.91 MiB

  • Сплит :

Трещина Примеры
'train' 853 422
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'et': Text(shape=(), dtype=tf.string),
})

para_crawl / enfi_plain_text

  • Описание конфигурации : Перевод набора данных с английского на фи, использует кодировщик plain_text.

  • Размер загрузки : 151.83 MiB

  • Сплит :

Трещина Примеры
'train' 2 156 069
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

para_crawl / enfr_plain_text

  • Описание конфигурации : Перевод набора данных с английского на fr, использует кодировщик plain_text.

  • Размер загружаемого файла : 2.63 GiB

  • Сплит :

Трещина Примеры
'train' 31 374 161
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fr': Text(shape=(), dtype=tf.string),
})

para_crawl / enga_plain_text

  • Описание конфигурации : перевод набора данных с английского на ga, использует кодировщик plain_text.

  • Размер загрузки : 28.03 MiB

  • Сплит :

Трещина Примеры
'train' 357 399
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ga': Text(shape=(), dtype=tf.string),
})

para_crawl / enhr_plain_text

  • Описание конфигурации : Перевод набора данных с английского на hr, использует кодировщик plain_text.

  • Размер загрузки : 80.97 MiB

  • Сплит :

Трещина Примеры
'train' 1 002 053
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hr': Text(shape=(), dtype=tf.string),
})

para_crawl / enhu_plain_text

  • Описание конфигурации : Перевод набора данных с английского на hu, использует кодировщик plain_text.

  • Размер загрузки : 114.24 MiB

  • Сплит :

Трещина Примеры
'train' 1 901 342
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hu': Text(shape=(), dtype=tf.string),
})

para_crawl / enit_plain_text

  • Описание конфигурации : Перевод набора данных с английского на него, использует кодировщик plain_text.

  • Размер загрузки : 1017.30 MiB

  • Сплит :

Трещина Примеры
'train' 12 162 239
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'it': Text(shape=(), dtype=tf.string),
})

para_crawl / enlt_plain_text

  • Описание конфигурации : Перевод набора данных с английского на lt, использует кодировщик plain_text.

  • Размер загрузки : 63.28 MiB

  • Сплит :

Трещина Примеры
'train' 844 643
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lt': Text(shape=(), dtype=tf.string),
})

para_crawl / enlv_plain_text

  • Описание конфигурации : Перевод набора данных с английского на lv, использует кодировщик plain_text.

  • Размер загрузки : 45.17 MiB

  • Сплит :

Трещина Примеры
'train' 553 060
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lv': Text(shape=(), dtype=tf.string),
})

para_crawl / enmt_plain_text

  • Описание конфигурации : Перевод набора данных с английского на mt, использует кодировщик plain_text.

  • Размер загрузки : 18.15 MiB

  • Сплит :

Трещина Примеры
'train' 195 502
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'mt': Text(shape=(), dtype=tf.string),
})

para_crawl / ennl_plain_text

  • Описание конфигурации : Перевод набора данных с английского на nl, использует кодировщик plain_text.

  • Размер загрузки : 400.63 MiB

  • Сплит :

Трещина Примеры
'train' 5 659 268
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'nl': Text(shape=(), dtype=tf.string),
})

para_crawl / enpl_plain_text

  • Описание конфигурации : Перевод набора данных с английского на pl, использует кодировщик plain_text.

  • Размер загрузки : 257.90 MiB

  • Сплит :

Трещина Примеры
'train' 3 503 276
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pl': Text(shape=(), dtype=tf.string),
})

para_crawl / enpt_plain_text

  • Описание конфигурации : Перевод набора данных с английского на pt, использует кодировщик plain_text.

  • Размер загрузки : 608.62 MiB

  • Сплит :

Трещина Примеры
'train' 8 141 940
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

para_crawl / enro_plain_text

  • Описание конфигурации : перевод набора данных с английского на ro, использует кодировщик plain_text.

  • Размер загрузки : 153.24 MiB

  • Сплит :

Трещина Примеры
'train' 1 952 043
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ro': Text(shape=(), dtype=tf.string),
})

para_crawl / ensk_plain_text

  • Описание конфигурации : Перевод набора данных с английского на sk, использует кодировщик plain_text.

  • Размер загрузки : 96.61 MiB

  • Сплит :

Трещина Примеры
'train' 1 591 831
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sk': Text(shape=(), dtype=tf.string),
})

para_crawl / ensl_plain_text

  • Описание конфигурации : перевод набора данных с английского на sl, использует кодировщик plain_text.

  • Размер загрузки : 62.02 MiB

  • Сплит :

Трещина Примеры
'train' 660 161
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sl': Text(shape=(), dtype=tf.string),
})

para_crawl / ensv_plain_text

  • Описание конфигурации : перевод набора данных с английского на sv, использует кодировщик plain_text.

  • Размер загрузки : 262.76 MiB

  • Сплит :

Трещина Примеры
'train' 3 476 729
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sv': Text(shape=(), dtype=tf.string),
})