Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

para_crawl

  • Описание:

Параллельные корпуса веб-масштаба для официальных европейских языков.

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl / enbg (конфигурация по умолчанию)

  • Описание Config: Перевод с английского набором данных на Б.Г..

  • Скачать Размер: 98.94 MiB

  • Dataset Размер: 362.46 MiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 1 039 885
  • Особенности:
Translation({
    'bg': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / encs

  • Описание Config: Перевод с английского набора данных для сСт.

  • Скачать Размер: 187.31 MiB

  • Dataset Размер: 666.34 MiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 2 981 949
  • Особенности:
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enda

  • Описание Config: Перевод с английского набора данных к да.

  • Скачать Размер: 174.34 MiB

  • Dataset Размер: 619.77 MiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 2 414 895
  • Особенности:
Translation({
    'da': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / ende

  • Описание Config: Перевод с английского набором данных для снятия.

  • Скачать Размер: 1.22 GiB

  • Dataset Размер: 4.04 GiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 16 264 448
  • Особенности:
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enel

  • Описание Config: Перевод с английского набора данных на эл.

  • Скачать Размер: 184.59 MiB

  • Dataset Размер: 698.75 MiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 1 985 233
  • Особенности:
Translation({
    'el': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enes

  • Описание Config: Перевод с английского набора данных для эс.

  • Скачать Размер: 1.82 GiB

  • Dataset Размер: 6.23 GiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 21 987 267
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'es': Text(shape=(), dtype=tf.string),
})

para_crawl / enet

  • Описание Config: Перевод с английского набора данных на ЕТ.

  • Скачать Размер: 66.91 MiB

  • Dataset Размер: 209.16 MiB

  • Авто-кэшируются ( документация ): Только при shuffle_files=False (поезд)

  • расколы:

Расколоть Примеры
'train' 853 422
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'et': Text(shape=(), dtype=tf.string),
})

para_crawl / enfi

  • Описание Config: Перевод с английского набора данных для фи.

  • Скачать Размер: 151.83 MiB

  • Dataset Размер: 543.85 MiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 2 156 069
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

para_crawl / enfr

  • Описание Config: Перевод с английского набором данных для фра.

  • Скачать Размер: 2.63 GiB

  • Dataset Размер: 9.04 GiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 31 374 161
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fr': Text(shape=(), dtype=tf.string),
})

para_crawl / enga

  • Описание Config: Перевод с английского набора данных для га.

  • Скачать Размер: 28.03 MiB

  • Dataset Размер: 107.09 MiB

  • Авто-кэшируются ( документация ): Да

  • расколы:

Расколоть Примеры
'train' 357 399
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ga': Text(shape=(), dtype=tf.string),
})

para_crawl / enhr

  • Описание Config: Перевод с английского набора данных в час.

  • Скачать Размер: 80.97 MiB

  • Dataset Размер: 256.37 MiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 1 002 053
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hr': Text(shape=(), dtype=tf.string),
})

para_crawl / enhu

  • Описание Config: Перевод с английского набора данных для Hu.

  • Скачать Размер: 114.24 MiB

  • Dataset Размер: 421.40 MiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 1 901 342
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hu': Text(shape=(), dtype=tf.string),
})

para_crawl / enit

  • Описание Config: Перевод с английского набора данных к нему.

  • Скачать Размер: 1017.30 MiB

  • Dataset Размер: 3.36 GiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 12 162 239
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'it': Text(shape=(), dtype=tf.string),
})

para_crawl / enlt

  • Описание Config: Перевод с английского набора данных для лт.

  • Скачать Размер: 63.28 MiB

  • Dataset Размер: 204.70 MiB

  • Авто-кэшируются ( документация ): Только при shuffle_files=False (поезд)

  • расколы:

Расколоть Примеры
'train' 844 643
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lt': Text(shape=(), dtype=tf.string),
})

para_crawl / enlv

  • Описание Config: Перевод с английского набором данных на ЛВ.

  • Скачать Размер: 45.17 MiB

  • Dataset Размер: 147.09 MiB

  • Авто-кэшируются ( документация ): Только при shuffle_files=False (поезд)

  • расколы:

Расколоть Примеры
'train' 553 060
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lv': Text(shape=(), dtype=tf.string),
})

para_crawl / enmt

  • Описание Config: Перевод с английского набора данных на мт.

  • Скачать Размер: 18.15 MiB

  • Dataset Размер: 54.36 MiB

  • Авто-кэшируются ( документация ): Да

  • расколы:

Расколоть Примеры
'train' 195 502
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'mt': Text(shape=(), dtype=tf.string),
})

para_crawl / ennl

  • Описание Config: Перевод с английского набором данных Н.Л..

  • Скачать Размер: 400.63 MiB

  • Dataset Размер: 1.40 GiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 5 659 268
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'nl': Text(shape=(), dtype=tf.string),
})

para_crawl / enpl

  • Описание Config: Перевод набора данных с Английский на пл.

  • Скачать Размер: 257.90 MiB

  • Dataset Размер: 885.63 MiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 3 503 276
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pl': Text(shape=(), dtype=tf.string),
})

para_crawl / enpt

  • Описание Config: Перевод с английского набора данных в пт.

  • Скачать Размер: 608.62 MiB

  • Dataset Размер: 2.05 GiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 8 141 940
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

para_crawl / enro

  • Описание Config: Перевод с английского набором данных ро.

  • Скачать Размер: 153.24 MiB

  • Dataset Размер: 534.34 MiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 1 952 043
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ro': Text(shape=(), dtype=tf.string),
})

para_crawl / ensk

  • Описание Config: Перевод с английского набором данных на Sk.

  • Скачать Размер: 96.61 MiB

  • Dataset Размер: 352.91 MiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 1 591 831
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sk': Text(shape=(), dtype=tf.string),
})

para_crawl / ensl

  • Описание Config: Перевод с английского набора данных на сл.

  • Скачать Размер: 62.02 MiB

  • Dataset Размер: 187.66 MiB

  • Авто-кэшируются ( документация ): Только при shuffle_files=False (поезд)

  • расколы:

Расколоть Примеры
'train' 660 161
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sl': Text(shape=(), dtype=tf.string),
})

para_crawl / ensv

  • Описание Config: Перевод с английского набором данных С.

  • Скачать Размер: 262.76 MiB

  • Dataset Размер: 905.72 MiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'train' 3 476 729
  • Особенности:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sv': Text(shape=(), dtype=tf.string),
})