flores

  • Descriptif :

Ensembles de données d'évaluation pour la traduction automatique à faibles ressources : népalais-anglais et cinghalais-anglais.

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

flores/neen (configuration par défaut)

  • Description de la configuration : ensemble de données de traduction de ne à en.

  • Taille du jeu de données : 1.89 MiB

  • Fractionnements :

Diviser Exemples
'test' 2 835
'validation' 2 559
  • Structure des fonctionnalités :
Translation({
    'en': Text(shape=(), dtype=string),
    'ne': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
Traduction
fr Texte chaîne de caractères
ne Texte chaîne de caractères

flores/siens

  • Description de la configuration : ensemble de données de traduction de si à en.

  • Taille du jeu de données : 2.05 MiB

  • Fractionnements :

Diviser Exemples
'test' 2 766
'validation' 2 898
  • Structure des fonctionnalités :
Translation({
    'en': Text(shape=(), dtype=string),
    'si': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
Traduction
fr Texte chaîne de caractères
si Texte chaîne de caractères