- توضیحات :
مجموعه داده های ارزیابی ترجمه ماشین با منابع کم: نپالی-انگلیسی و سینهالی-انگلیسی.
صفحه اصلی : https://github.com/facebookresearch/flores/
کد منبع :
tfds.translate.Flores
نسخه ها :
-
1.2.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه بارگیری :
1.47 MiB
ذخیره خودکار ( مستندات ): بله
نقل قول :
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
- شکل ( tfds.show_examples ): پشتیبانی نمی شود.
flores / neen (پیکربندی پیش فرض)
شرح پیکربندی : مجموعه داده ترجمه از ne به en.
اندازه مجموعه داده :
1.89 MiB
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 2835 |
'validation' | 2559 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'ne': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('ne', 'en')
مثالها ( tfds.as_dataframe ):
flores / sien
شرح پیکربندی : مجموعه داده ترجمه از si به en.
اندازه مجموعه داده :
2.05 MiB
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 2766 |
'validation' | 2898 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'si': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('si', 'en')
مثالها ( tfds.as_dataframe ):