fiori

  • Descrizione :

Set di dati di valutazione per la traduzione automatica con poche risorse: nepalese-inglese e singalese-inglese.

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

flores/neen (configurazione predefinita)

  • Descrizione della configurazione : set di dati di traduzione da ne a en.

  • Dimensione del set di dati: 1.89 MiB

  • Divisioni :

Diviso Esempi
'test' 2.835
'validation' 2.559
  • Struttura delle caratteristiche :
Translation({
    'en': Text(shape=(), dtype=string),
    'ne': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
Traduzione
it Testo corda
no Testo corda

flores/sien

  • Descrizione della configurazione : set di dati di traduzione da si a en.

  • Dimensione del set di dati : 2.05 MiB

  • Divisioni :

Diviso Esempi
'test' 2.766
'validation' 2.898
  • Struttura delle caratteristiche :
Translation({
    'en': Text(shape=(), dtype=string),
    'si': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
Traduzione
it Testo corda
si Testo corda