Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

wmt15_translate

  • Descripción:

Traducir el conjunto de datos según los datos de statmt.org.

Existen versiones para los diferentes años utilizando una combinación de múltiples fuentes de datos. La base wmt_translate le permite crear su propia configuración para elegir su propio par de datos / idioma mediante la creación de una costumbre tfds.translate.wmt.WmtConfig .

config = tfds.translate.wmt.WmtConfig(
    version="0.0.1",
    language_pair=("fr", "de"),
    subsets={
        tfds.Split.TRAIN: ["commoncrawl_frde"],
        tfds.Split.VALIDATION: ["euelections_dev2019"],
    },
)
builder = tfds.builder("wmt_translate", config=config)
  • Inicio: http://www.statmt.org/wmt15/translation-task.html

  • El código fuente: tfds.translate.Wmt15Translate

  • versiones:

    • 1.0.0 (por defecto): No hay notas de la versión.
  • Tamaño de conjunto de datos: Unknown size

  • Las instrucciones de descarga manual: Este conjunto de datos se requiere para descargar los datos de origen manualmente en download_config.manual_dir (por defecto ~/tensorflow_datasets/downloads/manual/ ):
    Algunas de las configuraciones de wmt aquí, requieren una descarga manual. Consulte wmt.py para ver la ruta exacta (y el nombre del archivo) que debe descargar.

  • Auto-caché ( documentación ): Desconocido

  • Figura ( tfds.show_examples ): No soportado.

  • Cita:

@InProceedings{bojar-EtAl:2015:WMT,
  author    = {Bojar, Ond
{r}ej  and  Chatterjee, Rajen  and  Federmann, Christian  and  Haddow, Barry  and  Huck, Matthias  and  Hokamp, Chris  and  Koehn, Philipp  and  Logacheva, Varvara  and  Monz, Christof  and  Negri, Matteo  and  Post, Matt  and  Scarton, Carolina  and  Specia, Lucia  and  Turchi, Marco},
  title     = {Findings of the 2015 Workshop on Statistical Machine Translation},
  booktitle = {Proceedings of the Tenth Workshop on Statistical Machine Translation},
  month     = {September},
  year      = {2015},
  address   = {Lisbon, Portugal},
  publisher = {Association for Computational Linguistics},
  pages     = {1--46},
  url       = {http://aclweb.org/anthology/W15-3001}
}

wmt15_translate / cs-en (configuración predeterminada)

  • Descripción config: WMT 2015 cs-en conjunto de datos tarea de traducción.

  • Tamaño del paquete: 1.62 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 2.656
'train' 15,793,126
'validation' 3.003
  • características:
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt15_translate / de-en

  • Descripción config: WMT 2015 de conjunto de datos-es tarea de traducción.

  • Tamaño del paquete: 1.62 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 2,169
'train' 4.522.998
'validation' 3.003
  • características:
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt15_translate / fi-en

  • Descripción config: WMT 2015 fi-en traducción de tareas conjunto de datos.

  • Tamaño del paquete: 260.51 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 1370
'train' 2,073,394
'validation' 1500
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

wmt15_translate / fr-en

  • Descripción config: WMT 2015 fr-en traducción de tareas conjunto de datos.

  • Tamaño del paquete: 6.24 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 1500
'train' 40,853,298
'validation' 4.503
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fr': Text(shape=(), dtype=tf.string),
})

wmt15_translate / ru-en

  • Descripción config: WMT 2015 ru-en conjunto de datos tarea de traducción.

  • Tamaño del paquete: 1.02 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 2.818
'train' 2,495,081
'validation' 3.003
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})