flores

 • Mô tả :

Bộ dữ liệu đánh giá cho bản dịch máy sử dụng ít tài nguyên: tiếng Nepal-tiếng Anh và tiếng Sinhala-tiếng Anh.

@misc{guzmn2019new,
  title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
  author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
  year={2019},
  eprint={1902.01382},
  archivePrefix={arXiv},
  primaryClass={cs.CL}
}

flores/neen (cấu hình mặc định)

 • Mô tả cấu hình : Dịch tập dữ liệu từ ne sang en.

 • Kích thước tập dữ liệu : 1.89 MiB

 • Chia tách :

Tách ra ví dụ
'test' 2.835
'validation' 2.559
 • Cấu trúc tính năng :
Translation({
  'en': Text(shape=(), dtype=string),
  'ne': Text(shape=(), dtype=string),
})
 • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Dịch
vi Chữ sợi dây
ne Chữ sợi dây

hoa/sien

 • Mô tả cấu hình : Dịch tập dữ liệu từ si sang en.

 • Kích thước tập dữ liệu : 2.05 MiB

 • Chia tách :

Tách ra ví dụ
'test' 2.766
'validation' 2.898
 • Cấu trúc tính năng :
Translation({
  'en': Text(shape=(), dtype=string),
  'si': Text(shape=(), dtype=string),
})
 • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Dịch
vi Chữ sợi dây
si Chữ sợi dây