flores

  • বর্ণনা :

স্বল্প-সম্পদ মেশিন অনুবাদের জন্য মূল্যায়ন ডেটাসেট: নেপালি-ইংরেজি এবং সিংহলা-ইংরেজি।

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

flores/neen (ডিফল্ট কনফিগারেশন)

  • কনফিগারেশনের বিবরণ : অনুবাদ ডেটাসেট ne থেকে en.

  • ডেটাসেটের আকার : 1.89 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 2,835
'validation' 2,559
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'ne': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
ne পাঠ্য স্ট্রিং

flores/sien

  • কনফিগারেশনের বিবরণ : si থেকে en পর্যন্ত অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 2.05 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 2,766
'validation' 2,898
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'si': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
si পাঠ্য স্ট্রিং