flores

  • Descripción :

Conjuntos de datos de evaluación para traducción automática de bajos recursos: nepalí-inglés y cingalés-inglés.

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

flores/neen (configuración predeterminada)

  • Descripción de la configuración : conjunto de datos de traducción de ne a en.

  • Tamaño del conjunto de datos : 1.89 MiB

  • Divisiones :

Separar Ejemplos
'test' 2,835
'validation' 2,559
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ne': Text(shape=(), dtype=tf.string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto tf.cadena
nordeste Texto tf.cadena

flores/sién

  • Descripción de la configuración : conjunto de datos de traducción de si a en.

  • Tamaño del conjunto de datos : 2.05 MiB

  • Divisiones :

Separar Ejemplos
'test' 2,766
'validation' 2,898
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'si': Text(shape=(), dtype=tf.string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto tf.cadena
si Texto tf.cadena