ted_hrlr_translate

  • विवरण :

समान भाषा युग्मों की तुलना करने के लिए टेड टॉक ट्रांस्क्रिप्ट से प्राप्त डेटा सेट जहां एक उच्च संसाधन है और दूसरा कम संसाधन है।

@inproceedings{Ye2018WordEmbeddings,
  author  = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
  title   = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
  booktitle = {HLT-NAACL},
  year    = {2018},
  }

ted_hrlr_translate/az_to_en (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फिग विवरण : सादा पाठ में एज़ से एन तक अनुवाद डेटासेट।

  • डेटासेट का आकार : 1.61 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 903
'train' 5,946
'validation' 671
  • फ़ीचर संरचना :
Translation({
    'az': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
अज़ मूलपाठ डोरी
एन मूलपाठ डोरी

ted_hrlr_translate/aztr_to_en

  • कॉन्फ़िग विवरण : सादे पाठ में डेटासेट का az_tr से en में अनुवाद।

  • डेटासेट का आकार : 42.54 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 903
'train' 188,396
'validation' 671
  • फ़ीचर संरचना :
Translation({
    'az_tr': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
az_tr मूलपाठ डोरी
एन मूलपाठ डोरी

ted_hrlr_translate/be_to_en

  • कॉन्फिग विवरण : सादे पाठ में अनुवाद डेटासेट बी से एन तक।

  • डेटासेट का आकार : 1.47 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 664
'train' 4,509
'validation' 248
  • फ़ीचर संरचना :
Translation({
    'be': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
होना मूलपाठ डोरी
एन मूलपाठ डोरी

ted_hrlr_translate/beru_to_en

  • कॉन्फ़िग विवरण : सादे पाठ में be_ru से en तक अनुवाद डेटासेट।

  • डेटासेट का आकार : 62.45 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 664
'train' 212,614
'validation' 248
  • फ़ीचर संरचना :
Translation({
    'be_ru': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
be_ru मूलपाठ डोरी
एन मूलपाठ डोरी

ted_hrlr_translate/es_to_pt

  • कॉन्फ़िग विवरण : सादा पाठ में es से pt तक अनुवाद डेटासेट।

  • डेटासेट का आकार : 9.62 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 1,763
'train' 44,938
'validation' 1,016
  • फ़ीचर संरचना :
Translation({
    'es': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
तों मूलपाठ डोरी
पं मूलपाठ डोरी

ted_hrlr_translate/fr_to_pt

  • कॉन्फ़िग विवरण : सादा पाठ में fr से pt तक अनुवाद डेटासेट।

  • डेटासेट का आकार : 9.74 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 1,494
'train' 43,873
'validation' 1,131
  • फ़ीचर संरचना :
Translation({
    'fr': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
फादर मूलपाठ डोरी
पं मूलपाठ डोरी

ted_hrlr_translate/gl_to_en

  • कॉन्फिग विवरण : सादा पाठ में जीएल से एन तक अनुवाद डेटासेट।

  • डेटासेट का आकार : 2.41 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 1,007
'train' 10,017
'validation' 682
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'gl': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
जीएल मूलपाठ डोरी

ted_hrlr_translate/glpt_to_en

  • Config विवरण : सादा पाठ में अनुवाद डेटासेट gl_pt से en करने के लिए।

  • डेटासेट का आकार : 12.90 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 1,007
'train' 61,802
'validation' 682
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'gl_pt': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
gl_pt मूलपाठ डोरी

ted_hrlr_translate/he_to_pt

  • कॉन्फिग विवरण : सादे पाठ में अनुवाद डेटासेट से पीटी तक।

  • डेटासेट का आकार : 11.71 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 1,623
'train' 48,511
'validation' 1,145
  • फ़ीचर संरचना :
Translation({
    'he': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
वह मूलपाठ डोरी
पं मूलपाठ डोरी

ted_hrlr_translate/it_to_pt

  • Config विवरण : सादा पाठ में अनुवाद डेटासेट से pt करने के लिए।

  • डेटासेट का आकार : 9.94 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 1,669
'train' 46,259
'validation' 1,162
  • फ़ीचर संरचना :
Translation({
    'it': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
यह मूलपाठ डोरी
पं मूलपाठ डोरी

ted_hrlr_translate/pt_to_en

  • कॉन्फिग विवरण : डेटासेट का पीटी से एन तक सादे पाठ में अनुवाद।

  • डेटासेट का आकार : 10.89 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 1,803
'train' 51,785
'validation' 1,193
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
पं मूलपाठ डोरी

ted_hrlr_translate/ru_to_en

  • विन्यास विवरण : सादे पाठ में आरयू से एन तक अनुवाद डेटासेट।

  • डेटासेट का आकार : 63.22 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 5,476
'train' 208,106
'validation' 4,805
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
आरयू मूलपाठ डोरी

ted_hrlr_translate/ru_to_pt

  • विन्यास विवरण : सादे पाठ में आरयू से पीटी तक अनुवाद डेटासेट।

  • डेटासेट का आकार : 13.00 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 1,588
'train' 47,278
'validation' 1,184
  • फ़ीचर संरचना :
Translation({
    'pt': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
पं मूलपाठ डोरी
आरयू मूलपाठ डोरी

ted_hrlr_translate/tr_to_en

  • कॉन्फ़िग विवरण : ट्रांसलेशन डेटासेट tr से en में प्लेन टेक्स्ट में।

  • डेटासेट का आकार : 42.33 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 5,029
'train' 182,450
'validation' 4,045
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'tr': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
टी.आर. मूलपाठ डोरी