- תיאור:
מערכי נתונים להערכה לתרגום מכונות בעל משאבים נמוכים: נפאלית-אנגלית וסינגלית-אנגלית.
קוד מקור:
tfds.translate.Flores
גרסאות:
-
1.2.0
(ברירת המחדל): הערות השחרור לא.
-
גודל ההורדה:
1.47 MiB
Auto-במטמון ( תיעוד ): כן
איור ( tfds.show_examples ): לא נתמך.
ציטוט:
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
flores/neen (ברירת מחדל)
תיאור Config: הנתונים תרגום ne כדי en.
מערך נתונים גודל:
1.89 MiB
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'test' | 2,835 |
'validation' | 2,559 |
- מאפיינים:
Translation({
'en': Text(shape=(), dtype=tf.string),
'ne': Text(shape=(), dtype=tf.string),
})
מפתחות השגחה (ראה
as_supervised
doc ):('ne', 'en')
דוגמאות ( tfds.as_dataframe ):
flores/sien
תיאור Config: הנתונים תרגום סי כדי en.
מערך נתונים גודל:
2.05 MiB
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'test' | 2,766 |
'validation' | 2,898 |
- מאפיינים:
Translation({
'en': Text(shape=(), dtype=tf.string),
'si': Text(shape=(), dtype=tf.string),
})
מפתחות השגחה (ראה
as_supervised
doc ):('si', 'en')
דוגמאות ( tfds.as_dataframe ):