Sintonizar con las primeras mujeres en ML Simposio este martes, 19 de octubre a 09 a.m. PST Registrar ahora

para_crawl

  • Descripción:

Corpus paralelos a escala web para idiomas europeos oficiales.

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl / enbg (configuración predeterminada)

  • Descripción config: conjunto de datos traducción del Inglés a BG.

  • Tamaño del paquete: 98.94 MiB

  • Conjunto de datos de tamaño: 362.46 MiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 1.039.885
  • características:
Translation({
    'bg': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / encs

  • Descripción config: conjunto de datos traducción del Inglés al CS.

  • Tamaño del paquete: 187.31 MiB

  • Conjunto de datos de tamaño: 666.34 MiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 2,981,949
  • características:
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enda

  • Descripción config: conjunto de datos traducción del Inglés al da.

  • Tamaño del paquete: 174.34 MiB

  • Conjunto de datos de tamaño: 619.77 MiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 2,414,895
  • características:
Translation({
    'da': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / ende

  • Descripción config: conjunto de datos traducción del Inglés al DE.

  • Tamaño del paquete: 1.22 GiB

  • Tamaño de conjunto de datos: 4.04 GiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 16,264,448
  • características:
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enel

  • Descripción config: conjunto de datos traducción del Inglés a el.

  • Tamaño del paquete: 184.59 MiB

  • Conjunto de datos de tamaño: 698.75 MiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 1,985,233
  • características:
Translation({
    'el': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl / enes

  • Descripción config: conjunto de datos traducción del Inglés, a ej.

  • Tamaño del paquete: 1.82 GiB

  • Tamaño de conjunto de datos: 6.23 GiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 21,987,267
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'es': Text(shape=(), dtype=tf.string),
})

para_crawl / enet

  • Descripción config: conjunto de datos traducción del Inglés al et.

  • Tamaño del paquete: 66.91 MiB

  • Conjunto de datos de tamaño: 209.16 MiB

  • Auto-caché ( documentación ): Sólo cuando shuffle_files=False (tren)

  • Fraccionamientos:

Separar Ejemplos de
'train' 853,422
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'et': Text(shape=(), dtype=tf.string),
})

para_crawl / enfi

  • Descripción config: conjunto de datos traducción del Inglés al fi.

  • Tamaño del paquete: 151.83 MiB

  • Conjunto de datos de tamaño: 543.85 MiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 2,156,069
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

para_crawl / enfr

  • Descripción config: conjunto de datos traducción del Inglés al documento FR.

  • Tamaño del paquete: 2.63 GiB

  • Tamaño de conjunto de datos: 9.04 GiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 31,374,161
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fr': Text(shape=(), dtype=tf.string),
})

para_crawl / enga

  • Descripción config: conjunto de datos traducción del Inglés al ga.

  • Tamaño del paquete: 28.03 MiB

  • Conjunto de datos de tamaño: 107.09 MiB

  • Auto-caché ( documentación ): Sí

  • Fraccionamientos:

Separar Ejemplos de
'train' 357,399
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ga': Text(shape=(), dtype=tf.string),
})

para_crawl / enhr

  • Descripción config: conjunto de datos traducción del Inglés al hr.

  • Tamaño del paquete: 80.97 MiB

  • Conjunto de datos de tamaño: 256.37 MiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 1.002.053
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hr': Text(shape=(), dtype=tf.string),
})

para_crawl / enhu

  • Descripción config: conjunto de datos traducción del Inglés al hu.

  • Tamaño del paquete: 114.24 MiB

  • Conjunto de datos de tamaño: 421.40 MiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 1.901.342
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hu': Text(shape=(), dtype=tf.string),
})

para_crawl / enit

  • Descripción config: conjunto de datos traducción del Inglés al mismo.

  • Tamaño del paquete: 1017.30 MiB

  • Tamaño de conjunto de datos: 3.36 GiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 12,162,239
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'it': Text(shape=(), dtype=tf.string),
})

para_crawl / enlt

  • Descripción config: conjunto de datos traducción del Inglés al lt.

  • Tamaño del paquete: 63.28 MiB

  • Conjunto de datos de tamaño: 204.70 MiB

  • Auto-caché ( documentación ): Sólo cuando shuffle_files=False (tren)

  • Fraccionamientos:

Separar Ejemplos de
'train' 844,643
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lt': Text(shape=(), dtype=tf.string),
})

para_crawl / enlv

  • Descripción config: conjunto de datos traducción del Inglés al ventrículo izquierdo.

  • Tamaño del paquete: 45.17 MiB

  • Conjunto de datos de tamaño: 147.09 MiB

  • Auto-caché ( documentación ): Sólo cuando shuffle_files=False (tren)

  • Fraccionamientos:

Separar Ejemplos de
'train' 553.060
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lv': Text(shape=(), dtype=tf.string),
})

para_crawl / enmt

  • Descripción config: conjunto de datos traducción del Inglés a mt.

  • Tamaño del paquete: 18.15 MiB

  • Conjunto de datos de tamaño: 54.36 MiB

  • Auto-caché ( documentación ): Sí

  • Fraccionamientos:

Separar Ejemplos de
'train' 195,502
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'mt': Text(shape=(), dtype=tf.string),
})

para_crawl / ennl

  • Descripción config: conjunto de datos traducción del Inglés al NL.

  • Tamaño del paquete: 400.63 MiB

  • Tamaño de conjunto de datos: 1.40 GiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 5,659,268
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'nl': Text(shape=(), dtype=tf.string),
})

para_crawl / enpl

  • Descripción config: conjunto de datos traducción del Inglés al PL.

  • Tamaño del paquete: 257.90 MiB

  • Conjunto de datos de tamaño: 885.63 MiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 3,503,276
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pl': Text(shape=(), dtype=tf.string),
})

para_crawl / enpt

  • Descripción config: conjunto de datos traducción del Inglés al PT.

  • Tamaño del paquete: 608.62 MiB

  • Tamaño de conjunto de datos: 2.05 GiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 8.141.940
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

para_crawl / enro

  • Descripción config: conjunto de datos traducción del Inglés al rodado.

  • Tamaño del paquete: 153.24 MiB

  • Conjunto de datos de tamaño: 534.34 MiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 1.952.043
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ro': Text(shape=(), dtype=tf.string),
})

para_crawl / ensk

  • Descripción config: conjunto de datos traducción del Inglés al Sk.

  • Tamaño del paquete: 96.61 MiB

  • Conjunto de datos de tamaño: 352.91 MiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 1,591,831
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sk': Text(shape=(), dtype=tf.string),
})

para_crawl / ensl

  • Descripción config: conjunto de datos traducción del Inglés al sl.

  • Tamaño del paquete: 62.02 MiB

  • Conjunto de datos de tamaño: 187.66 MiB

  • Auto-caché ( documentación ): Sólo cuando shuffle_files=False (tren)

  • Fraccionamientos:

Separar Ejemplos de
'train' 660,161
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sl': Text(shape=(), dtype=tf.string),
})

para_crawl / ensv

  • Descripción config: conjunto de datos traducción del Inglés al SV.

  • Tamaño del paquete: 262.76 MiB

  • Conjunto de datos de tamaño: 905.72 MiB

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'train' 3.476.729
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sv': Text(shape=(), dtype=tf.string),
})