Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

Flores

  • opis:

Zestawy danych ewaluacyjnych do tłumaczenia maszynowego o niskich zasobach: nepalsko-angielski i syngaleski-angielski.

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

flores/neen (konfiguracja domyślna)

  • Opis config: Tłumaczenie z zestawu danych ne do pl.

  • Zbiór danych Rozmiar: 1.89 MiB

  • dzieli:

Podział Przykłady
'test' 2835
'validation' 2 559
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ne': Text(shape=(), dtype=tf.string),
})

flores/sien

  • Opis config: zbiór danych Tłumaczenie z Si na pl.

  • Zbiór danych Rozmiar: 2.05 MiB

  • dzieli:

Podział Przykłady
'test' 2766
'validation' 2898
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'si': Text(shape=(), dtype=tf.string),
})