Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

wmt16_translate

  • Descripción:

Traducir el conjunto de datos según los datos de statmt.org.

Existen versiones para los diferentes años utilizando una combinación de múltiples fuentes de datos. La base wmt_translate le permite crear su propia configuración para elegir su propio par de datos / idioma mediante la creación de una costumbre tfds.translate.wmt.WmtConfig .

config = tfds.translate.wmt.WmtConfig(
    version="0.0.1",
    language_pair=("fr", "de"),
    subsets={
        tfds.Split.TRAIN: ["commoncrawl_frde"],
        tfds.Split.VALIDATION: ["euelections_dev2019"],
    },
)
builder = tfds.builder("wmt_translate", config=config)
  • Inicio: http://www.statmt.org/wmt16/translation-task.html

  • El código fuente: tfds.translate.Wmt16Translate

  • versiones:

    • 1.0.0 (por defecto): No hay notas de la versión.
  • Tamaño de conjunto de datos: Unknown size

  • Las instrucciones de descarga manual: Este conjunto de datos se requiere para descargar los datos de origen manualmente en download_config.manual_dir (por defecto ~/tensorflow_datasets/downloads/manual/ ):
    Algunas de las configuraciones de wmt aquí requieren una descarga manual. Consulte wmt.py para ver la ruta exacta (y el nombre del archivo) que debe descargar.

  • Auto-caché ( documentación ): Desconocido

  • Figura ( tfds.show_examples ): No soportado.

  • Cita:

@InProceedings{bojar-EtAl:2016:WMT1,
  author    = {Bojar, Ond
{r}ej  and  Chatterjee, Rajen  and  Federmann, Christian  and  Graham, Yvette  and  Haddow, Barry  and  Huck, Matthias  and  Jimeno Yepes, Antonio  and  Koehn, Philipp  and  Logacheva, Varvara  and  Monz, Christof  and  Negri, Matteo  and  Neveol, Aurelie  and  Neves, Mariana  and  Popel, Martin  and  Post, Matt  and  Rubino, Raphael  and  Scarton, Carolina  and  Specia, Lucia  and  Turchi, Marco  and  Verspoor, Karin  and  Zampieri, Marcos},
  title     = {Findings of the 2016 Conference on Machine Translation},
  booktitle = {Proceedings of the First Conference on Machine Translation},
  month     = {August},
  year      = {2016},
  address   = {Berlin, Germany},
  publisher = {Association for Computational Linguistics},
  pages     = {131--198},
  url       = {http://www.aclweb.org/anthology/W/W16/W16-2301}
}

wmt16_translate / cs-en (configuración predeterminada)

  • Descripción config: WMT 2016 cs-en conjunto de datos tarea de traducción.

  • Tamaño del paquete: 1.57 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 2,999
'train' 52,335,651
'validation' 2.656
  • características:
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt16_translate / de-en

  • Descripción config: WMT 2016 de conjunto de datos-es tarea de traducción.

  • Tamaño del paquete: 1.57 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 2,999
'train' 4,548,885
'validation' 2,169
  • características:
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt16_translate / fi-en

  • Descripción config: WMT 2016 fi-en traducción de tareas conjunto de datos.

  • Tamaño del paquete: 260.51 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 6.000
'train' 2,073,394
'validation' 1370
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

wmt16_translate / ro-en

  • Descripción config: WMT 2016 ro-en traducción de tareas conjunto de datos.

  • Tamaño del paquete: 273.83 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 1,999
'train' 610,320
'validation' 1,999
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ro': Text(shape=(), dtype=tf.string),
})

wmt16_translate / ru-en

  • Descripción config: WMT 2016 ru-en conjunto de datos tarea de traducción.

  • Tamaño del paquete: 993.38 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 2,998
'train' 2,516,162
'validation' 2.818
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})

wmt16_translate / tr-es

  • Descripción config: WMT 2016 TR-en traducción de tareas conjunto de datos.

  • Tamaño del paquete: 59.32 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 3000
'train' 205,756
'validation' 1,001
  • características:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'tr': Text(shape=(), dtype=tf.string),
})