ted_hrlr_translate

  • توضیحات :

مجموعه داده‌های مشتق شده از رونوشت‌های گفتگوی TED برای مقایسه جفت‌های زبانی مشابه که در آن یکی از منابع بالا و دیگری منابع کم است.

@inproceedings{Ye2018WordEmbeddings,
  author  = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
  title   = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
  booktitle = {HLT-NAACL},
  year    = {2018},
  }

ted_hrlr_translate/az_to_en (پیکربندی پیش فرض)

  • توضیحات پیکربندی : مجموعه داده های ترجمه از az به en در متن ساده.

  • حجم مجموعه داده : 1.61 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 903
'train' 5,946
'validation' 671
  • ساختار ویژگی :
Translation({
    'az': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
az متن رشته
en متن رشته

ted_hrlr_translate/aztr_to_en

  • توضیحات پیکربندی : مجموعه داده های ترجمه از az_tr به en در متن ساده.

  • حجم مجموعه داده : 42.54 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 903
'train' 188,396
'validation' 671
  • ساختار ویژگی :
Translation({
    'az_tr': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
az_tr متن رشته
en متن رشته

ted_hrlr_translate/be_to_en

  • توضیحات پیکربندی : مجموعه داده های ترجمه از be به en در متن ساده.

  • حجم مجموعه داده : 1.47 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 664
'train' 4509
'validation' 248
  • ساختار ویژگی :
Translation({
    'be': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
بودن متن رشته
en متن رشته

ted_hrlr_translate/beru_to_en

  • توضیحات پیکربندی : مجموعه داده های ترجمه از be_ru به en در متن ساده.

  • حجم مجموعه داده : 62.45 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 664
'train' 212614
'validation' 248
  • ساختار ویژگی :
Translation({
    'be_ru': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
be_ru متن رشته
en متن رشته

ted_hrlr_translate/es_to_pt

  • توضیحات پیکربندی : مجموعه داده های ترجمه از es به pt در متن ساده.

  • حجم مجموعه داده : 9.62 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 1763
'train' 44938
'validation' 1,016
  • ساختار ویژگی :
Translation({
    'es': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
es متن رشته
pt متن رشته

ted_hrlr_translate/fr_to_pt

  • توضیحات پیکربندی : مجموعه داده های ترجمه از fr به pt در متن ساده.

  • حجم مجموعه داده : 9.74 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 1,494
'train' 43,873
'validation' 1,131
  • ساختار ویژگی :
Translation({
    'fr': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
fr متن رشته
pt متن رشته

ted_hrlr_translate/gl_to_en

  • توضیحات پیکربندی : مجموعه داده های ترجمه از gl به en در متن ساده.

  • حجم مجموعه داده : 2.41 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 1007
'train' 10,017
'validation' 682
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'gl': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
gl متن رشته

ted_hrlr_translate/glpt_to_en

  • توضیحات پیکربندی : مجموعه داده های ترجمه از gl_pt به en در متن ساده.

  • حجم مجموعه داده : 12.90 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 1007
'train' 61,802
'validation' 682
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'gl_pt': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
gl_pt متن رشته

ted_hrlr_translate/he_to_pt

  • توضیحات پیکربندی : مجموعه داده ترجمه از او به pt در متن ساده.

  • حجم مجموعه داده : 11.71 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 1623
'train' 48511
'validation' 1,145
  • ساختار ویژگی :
Translation({
    'he': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
او متن رشته
pt متن رشته

ted_hrlr_translate/it_to_pt

  • توضیحات پیکربندی : مجموعه داده های ترجمه از آن به pt در متن ساده.

  • حجم مجموعه داده : 9.94 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 1669
'train' 46259
'validation' 1,162
  • ساختار ویژگی :
Translation({
    'it': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
آی تی متن رشته
pt متن رشته

ted_hrlr_translate/pt_to_en

  • توضیحات پیکربندی : مجموعه داده های ترجمه از pt به en در متن ساده.

  • حجم مجموعه داده : 10.89 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 1,803
'train' 51,785
'validation' 1193
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
pt متن رشته

ted_hrlr_translate/ru_to_en

  • توضیحات پیکربندی : مجموعه داده های ترجمه از ru به en در متن ساده.

  • حجم مجموعه داده : 63.22 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 5,476
'train' 208,106
'validation' 4805
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
ru متن رشته

ted_hrlr_translate/ru_to_pt

  • توضیحات پیکربندی : مجموعه داده های ترجمه از ru به pt در متن ساده.

  • حجم مجموعه داده : 13.00 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 1,588
'train' 47278
'validation' 1184
  • ساختار ویژگی :
Translation({
    'pt': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
pt متن رشته
ru متن رشته

ted_hrlr_translate/tr_to_en

  • توضیحات پیکربندی : مجموعه داده های ترجمه از tr به en در متن ساده.

  • حجم مجموعه داده : 42.33 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 5,029
'train' 182,450
'validation' 4,045
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'tr': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
tr متن رشته