Эта страница была переведа с помощью Cloud Translation API.
Switch to English

Флорес

  • Описание :

Наборы оценочных данных для машинного перевода с низким уровнем ресурсов: непальский-английский и сингальский-английский.

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

flores / neen_plain_text (конфигурация по умолчанию)

  • Описание конфигурации : Перевод набора данных с ne на en, использует кодировщик plain_text.

  • Размер набора данных : 1.89 MiB

  • Сплит :

Трещина Примеры
'test' 2 835
'validation' 2,559
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ne': Text(shape=(), dtype=tf.string),
})

flores / sien_plain_text

  • Описание конфигурации : для перевода набора данных из si в en используется кодировщик plain_text.

  • Размер набора данных : 2.05 MiB

  • Сплит :

Трещина Примеры
'test' 2 766
'validation' 2 898
  • Особенности :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'si': Text(shape=(), dtype=tf.string),
})