तातोइबा

  • विवरण :

यह डेटा Tatoeba कॉर्पस, दिनांकित शनिवार 2018/11/17 से निकाला गया है।

प्रत्येक भाषा के लिए, हमने 1000 अंग्रेजी वाक्यों और उनके अनुवादों का चयन किया है, यदि उपलब्ध हो। भाषाओं, उनके परिवारों और लिपियों के विवरण के साथ-साथ आधारभूत परिणामों के लिए कृपया इस पेपर को देखें।

कृपया ध्यान दें कि अंग्रेजी के वाक्य सभी भाषा युग्मों के लिए समान नहीं हैं। इसका मतलब यह है कि परिणाम सीधे भाषाओं में तुलनीय नहीं हैं।

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
स्रोत भाषा मूलपाठ डोरी
स्रोत वाक्य मूलपाठ डोरी
लक्ष्य भाषा मूलपाठ डोरी
target_sentence मूलपाठ डोरी
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba/tatoeba_af (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • डाउनलोड का आकार : 58.24 KiB

  • डेटासेट का आकार : 162.74 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_ar

  • डाउनलोड आकार : 70.95 KiB

  • डेटासेट का आकार : 175.46 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_bg

  • डाउनलोड आकार : 99.88 KiB

  • डेटासेट का आकार : 204.64 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_bn

  • डाउनलोड आकार : 89.55 KiB

  • डेटासेट का आकार : 194.24 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_de

  • डाउनलोड आकार : 103.09 KiB

  • डेटासेट का आकार : 207.93 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_el

  • डाउनलोड आकार : 77.11 KiB

  • डेटासेट का आकार : 181.65 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_es

  • डाउनलोड आकार : 70.57 KiB

  • डेटासेट का आकार : 175.12 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_et

  • डाउनलोड आकार : 58.33 KiB

  • डेटासेट का आकार : 162.85 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_eu

  • डाउनलोड आकार : 64.52 KiB

  • डेटासेट का आकार : 169.02 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_fa

  • डाउनलोड आकार : 91.52 KiB

  • डेटासेट का आकार : 196.15 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_fi

  • डाउनलोड आकार : 73.90 KiB

  • डेटासेट का आकार : 178.47 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_fr

  • डाउनलोड का आकार : 78.14 KiB

  • डेटासेट का आकार : 182.68 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_he

  • डाउनलोड आकार : 81.54 KiB

  • डेटासेट का आकार : 186.15 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_hi

  • डाउनलोड आकार : 119.69 KiB

  • डेटासेट का आकार : 224.89 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_hu

  • डाउनलोड का आकार : 67.27 KiB

  • डेटासेट का आकार : 171.78 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_id

  • डाउनलोड आकार : 73.09 KiB

  • डेटासेट का आकार : 177.61 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_it

  • डाउनलोड आकार : 64.29 KiB

  • डेटासेट का आकार : 168.81 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_ja

  • डाउनलोड आकार : 90.90 KiB

  • डेटासेट का आकार : 195.53 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_jv

  • डाउनलोड आकार : 13.59 KiB

  • डेटासेट का आकार : 35.01 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 205

tatoeba/tatoeba_ka

  • डाउनलोड का आकार : 70.47 KiB

  • डेटासेट का आकार : 148.67 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 746

tatoeba/tatoeba_kk

  • डाउनलोड आकार : 46.07 KiB

  • डेटासेट का आकार : 106.25 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 575

tatoeba/tatoeba_ko

  • डाउनलोड आकार : 77.28 KiB

  • डेटासेट का आकार : 181.88 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_ml

  • डाउनलोड आकार : 92.50 KiB

  • डेटासेट का आकार : 165.14 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 687

tatoeba/tatoeba_mr

  • डाउनलोड का आकार : 98.19 KiB

  • डेटासेट का आकार : 202.96 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_nl

  • डाउनलोड आकार : 71.55 KiB

  • डेटासेट का आकार : 176.10 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_pt

  • डाउनलोड आकार : 73.42 KiB

  • डेटासेट का आकार : 177.95 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_ru

  • डाउनलोड आकार : 90.30 KiB

  • डेटासेट का आकार : 194.92 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_sw

  • डाउनलोड आकार : 19.99 KiB

  • डेटासेट का आकार : 60.75 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 390

tatoeba/tatoeba_ta

  • डाउनलोड आकार : 38.52 KiB

  • डेटासेट का आकार : 70.93 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 307

tatoeba/tatoeba_te

  • डाउनलोड आकार : 24.55 KiB

  • डेटासेट का आकार : 49.07 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 234

tatoeba/tatoeba_th

  • डाउनलोड आकार : 61.72 KiB

  • डेटासेट का आकार : 119.32 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 548

tatoeba/tatoeba_tl

  • डाउनलोड आकार : 66.54 KiB

  • डेटासेट का आकार : 171.04 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_tr

  • डाउनलोड आकार : 70.20 KiB

  • डेटासेट का आकार : 174.70 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_ur

  • डाउनलोड आकार : 86.63 KiB

  • डेटासेट का आकार : 191.20 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_vi

  • डाउनलोड आकार : 89.26 KiB

  • डेटासेट का आकार : 193.89 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_zh

  • डाउनलोड आकार : 67.32 KiB

  • डेटासेट का आकार : 171.85 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000
,

  • विवरण :

यह डेटा Tatoeba कॉर्पस, दिनांकित शनिवार 2018/11/17 से निकाला गया है।

प्रत्येक भाषा के लिए, हमने 1000 अंग्रेजी वाक्यों और उनके अनुवादों का चयन किया है, यदि उपलब्ध हो। भाषाओं, उनके परिवारों और लिपियों के विवरण के साथ-साथ आधारभूत परिणामों के लिए कृपया इस पेपर को देखें।

कृपया ध्यान दें कि अंग्रेजी के वाक्य सभी भाषा युग्मों के लिए समान नहीं हैं। इसका मतलब यह है कि परिणाम सीधे भाषाओं में तुलनीय नहीं हैं।

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
स्रोत भाषा मूलपाठ डोरी
स्रोत वाक्य मूलपाठ डोरी
लक्ष्य भाषा मूलपाठ डोरी
target_sentence मूलपाठ डोरी
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba/tatoeba_af (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • डाउनलोड का आकार : 58.24 KiB

  • डेटासेट का आकार : 162.74 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_ar

  • डाउनलोड आकार : 70.95 KiB

  • डेटासेट का आकार : 175.46 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_bg

  • डाउनलोड आकार : 99.88 KiB

  • डेटासेट का आकार : 204.64 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_bn

  • डाउनलोड आकार : 89.55 KiB

  • डेटासेट का आकार : 194.24 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_de

  • डाउनलोड आकार : 103.09 KiB

  • डेटासेट का आकार : 207.93 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_el

  • डाउनलोड आकार : 77.11 KiB

  • डेटासेट का आकार : 181.65 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_es

  • डाउनलोड आकार : 70.57 KiB

  • डेटासेट का आकार : 175.12 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_et

  • डाउनलोड आकार : 58.33 KiB

  • डेटासेट का आकार : 162.85 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_eu

  • डाउनलोड आकार : 64.52 KiB

  • डेटासेट का आकार : 169.02 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_fa

  • डाउनलोड आकार : 91.52 KiB

  • डेटासेट का आकार : 196.15 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_fi

  • डाउनलोड आकार : 73.90 KiB

  • डेटासेट का आकार : 178.47 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_fr

  • डाउनलोड का आकार : 78.14 KiB

  • डेटासेट का आकार : 182.68 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_he

  • डाउनलोड आकार : 81.54 KiB

  • डेटासेट का आकार : 186.15 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_hi

  • डाउनलोड आकार : 119.69 KiB

  • डेटासेट का आकार : 224.89 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_hu

  • डाउनलोड का आकार : 67.27 KiB

  • डेटासेट का आकार : 171.78 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_id

  • डाउनलोड आकार : 73.09 KiB

  • डेटासेट का आकार : 177.61 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_it

  • डाउनलोड आकार : 64.29 KiB

  • डेटासेट का आकार : 168.81 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_ja

  • डाउनलोड आकार : 90.90 KiB

  • डेटासेट का आकार : 195.53 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_jv

  • डाउनलोड आकार : 13.59 KiB

  • डेटासेट का आकार : 35.01 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 205

tatoeba/tatoeba_ka

  • डाउनलोड का आकार : 70.47 KiB

  • डेटासेट का आकार : 148.67 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 746

tatoeba/tatoeba_kk

  • डाउनलोड आकार : 46.07 KiB

  • डेटासेट का आकार : 106.25 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 575

tatoeba/tatoeba_ko

  • डाउनलोड आकार : 77.28 KiB

  • डेटासेट का आकार : 181.88 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_ml

  • डाउनलोड आकार : 92.50 KiB

  • डेटासेट का आकार : 165.14 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 687

tatoeba/tatoeba_mr

  • डाउनलोड का आकार : 98.19 KiB

  • डेटासेट का आकार : 202.96 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_nl

  • डाउनलोड आकार : 71.55 KiB

  • डेटासेट का आकार : 176.10 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_pt

  • डाउनलोड आकार : 73.42 KiB

  • डेटासेट का आकार : 177.95 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_ru

  • डाउनलोड आकार : 90.30 KiB

  • डेटासेट का आकार : 194.92 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_sw

  • डाउनलोड आकार : 19.99 KiB

  • डेटासेट का आकार : 60.75 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 390

tatoeba/tatoeba_ta

  • डाउनलोड आकार : 38.52 KiB

  • डेटासेट का आकार : 70.93 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 307

tatoeba/tatoeba_te

  • डाउनलोड आकार : 24.55 KiB

  • डेटासेट का आकार : 49.07 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 234

tatoeba/tatoeba_th

  • डाउनलोड आकार : 61.72 KiB

  • डेटासेट का आकार : 119.32 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 548

tatoeba/tatoeba_tl

  • डाउनलोड आकार : 66.54 KiB

  • डेटासेट का आकार : 171.04 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_tr

  • डाउनलोड आकार : 70.20 KiB

  • डेटासेट का आकार : 174.70 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_ur

  • डाउनलोड आकार : 86.63 KiB

  • डेटासेट का आकार : 191.20 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_vi

  • डाउनलोड आकार : 89.26 KiB

  • डेटासेट का आकार : 193.89 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000

tatoeba/tatoeba_zh

  • डाउनलोड आकार : 67.32 KiB

  • डेटासेट का आकार : 171.85 KiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,000