تاتوبا

  • توضیحات :

این داده ها از مجموعه Tatoeba مورخ شنبه 2018/11/17 استخراج شده است.

برای هر زبان، ما 1000 جمله انگلیسی و ترجمه آنها را در صورت وجود انتخاب کرده ایم. لطفاً این مقاله را برای توضیح زبان‌ها، خانواده‌ها و اسکریپت‌ها و همچنین نتایج پایه بررسی کنید.

لطفاً توجه داشته باشید که جملات انگلیسی برای همه جفت‌های زبانی یکسان نیستند. این بدان معنی است که نتایج به طور مستقیم در بین زبان ها قابل مقایسه نیستند.

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
منبع_زبان متن رشته
منبع_جمله متن رشته
زبان مقصد متن رشته
هدف_جمله متن رشته
@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba/tatoeba_af (پیکربندی پیش فرض)

  • حجم دانلود : 58.24 KiB

  • حجم مجموعه داده : 162.74 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_ar

  • حجم دانلود : 70.95 KiB

  • حجم مجموعه داده : 175.46 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_bg

  • حجم دانلود : 99.88 KiB

  • اندازه مجموعه داده : 204.64 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_bn

  • حجم دانلود : 89.55 KiB

  • حجم مجموعه داده : 194.24 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_de

  • حجم دانلود : 103.09 KiB

  • حجم مجموعه داده : 207.93 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_el

  • حجم دانلود : 77.11 KiB

  • حجم مجموعه داده : 181.65 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_es

  • حجم دانلود : 70.57 KiB

  • حجم مجموعه داده : 175.12 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_et

  • حجم دانلود : 58.33 KiB

  • حجم مجموعه داده : 162.85 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_eu

  • حجم دانلود : 64.52 KiB

  • اندازه مجموعه داده : 169.02 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_fa

  • حجم دانلود : 91.52 KiB

  • حجم مجموعه داده : 196.15 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_fi

  • حجم دانلود : 73.90 KiB

  • حجم مجموعه داده : 178.47 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_fr

  • حجم دانلود : 78.14 KiB

  • اندازه مجموعه داده : 182.68 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_he

  • حجم دانلود : 81.54 KiB

  • حجم مجموعه داده : 186.15 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_hi

  • حجم دانلود : 119.69 KiB

  • حجم مجموعه داده : 224.89 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_hu

  • حجم دانلود : 67.27 KiB

  • حجم مجموعه داده : 171.78 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_id

  • حجم دانلود : 73.09 KiB

  • حجم مجموعه داده : 177.61 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_it

  • حجم دانلود : 64.29 KiB

  • حجم مجموعه داده : 168.81 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_ja

  • حجم دانلود : 90.90 KiB

  • حجم مجموعه داده : 195.53 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_jv

  • حجم دانلود : 13.59 KiB

  • اندازه مجموعه داده : 35.01 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 205

tatoeba/tatoeba_ka

  • حجم دانلود : 70.47 KiB

  • حجم مجموعه داده : 148.67 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 746

tatoeba/tatoeba_kk

  • حجم دانلود : 46.07 KiB

  • حجم مجموعه داده : 106.25 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 575

tatoeba/tatoeba_ko

  • حجم دانلود : 77.28 KiB

  • حجم مجموعه داده : 181.88 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_ml

  • حجم دانلود : 92.50 KiB

  • حجم مجموعه داده : 165.14 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 687

tatoeba/tatoeba_mr

  • حجم دانلود : 98.19 KiB

  • حجم مجموعه داده : 202.96 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_nl

  • حجم دانلود : 71.55 KiB

  • حجم مجموعه داده : 176.10 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_pt

  • حجم دانلود : 73.42 KiB

  • حجم مجموعه داده : 177.95 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_ru

  • حجم دانلود : 90.30 KiB

  • حجم مجموعه داده : 194.92 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_sw

  • حجم دانلود : 19.99 KiB

  • اندازه مجموعه داده : 60.75 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 390

tatoeba/tatoeba_ta

  • حجم دانلود : 38.52 KiB

  • حجم مجموعه داده : 70.93 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 307

tatoeba/tatoeba_te

  • حجم دانلود : 24.55 KiB

  • اندازه مجموعه داده : 49.07 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 234

tatoeba/tatoeba_th

  • حجم دانلود : 61.72 KiB

  • حجم مجموعه داده : 119.32 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 548

tatoeba/tatoeba_tl

  • حجم دانلود : 66.54 KiB

  • حجم مجموعه داده : 171.04 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_tr

  • حجم دانلود : 70.20 KiB

  • حجم مجموعه داده : 174.70 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_ur

  • حجم دانلود : 86.63 KiB

  • حجم مجموعه داده : 191.20 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_vi

  • حجم دانلود : 89.26 KiB

  • حجم مجموعه داده : 193.89 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_zh

  • حجم دانلود : 67.32 KiB

  • اندازه مجموعه داده : 171.85 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000
،

  • توضیحات :

این داده ها از مجموعه Tatoeba مورخ شنبه 2018/11/17 استخراج شده است.

برای هر زبان، ما 1000 جمله انگلیسی و ترجمه آنها را در صورت وجود انتخاب کرده ایم. لطفاً این مقاله را برای توضیح زبان‌ها، خانواده‌ها و اسکریپت‌ها و همچنین نتایج پایه بررسی کنید.

لطفاً توجه داشته باشید که جملات انگلیسی برای همه جفت‌های زبانی یکسان نیستند. این بدان معنی است که نتایج به طور مستقیم در بین زبان ها قابل مقایسه نیستند.

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
منبع_زبان متن رشته
منبع_جمله متن رشته
زبان مقصد متن رشته
هدف_جمله متن رشته
@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba/tatoeba_af (پیکربندی پیش فرض)

  • حجم دانلود : 58.24 KiB

  • حجم مجموعه داده : 162.74 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_ar

  • حجم دانلود : 70.95 KiB

  • حجم مجموعه داده : 175.46 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_bg

  • حجم دانلود : 99.88 KiB

  • اندازه مجموعه داده : 204.64 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_bn

  • حجم دانلود : 89.55 KiB

  • حجم مجموعه داده : 194.24 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_de

  • حجم دانلود : 103.09 KiB

  • حجم مجموعه داده : 207.93 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_el

  • حجم دانلود : 77.11 KiB

  • حجم مجموعه داده : 181.65 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_es

  • حجم دانلود : 70.57 KiB

  • حجم مجموعه داده : 175.12 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_et

  • حجم دانلود : 58.33 KiB

  • حجم مجموعه داده : 162.85 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_eu

  • حجم دانلود : 64.52 KiB

  • اندازه مجموعه داده : 169.02 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_fa

  • حجم دانلود : 91.52 KiB

  • حجم مجموعه داده : 196.15 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_fi

  • حجم دانلود : 73.90 KiB

  • حجم مجموعه داده : 178.47 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_fr

  • حجم دانلود : 78.14 KiB

  • اندازه مجموعه داده : 182.68 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_he

  • حجم دانلود : 81.54 KiB

  • حجم مجموعه داده : 186.15 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_hi

  • حجم دانلود : 119.69 KiB

  • حجم مجموعه داده : 224.89 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_hu

  • حجم دانلود : 67.27 KiB

  • حجم مجموعه داده : 171.78 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_id

  • حجم دانلود : 73.09 KiB

  • حجم مجموعه داده : 177.61 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_it

  • حجم دانلود : 64.29 KiB

  • حجم مجموعه داده : 168.81 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_ja

  • حجم دانلود : 90.90 KiB

  • حجم مجموعه داده : 195.53 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_jv

  • حجم دانلود : 13.59 KiB

  • اندازه مجموعه داده : 35.01 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 205

tatoeba/tatoeba_ka

  • حجم دانلود : 70.47 KiB

  • حجم مجموعه داده : 148.67 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 746

tatoeba/tatoeba_kk

  • حجم دانلود : 46.07 KiB

  • حجم مجموعه داده : 106.25 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 575

tatoeba/tatoeba_ko

  • حجم دانلود : 77.28 KiB

  • حجم مجموعه داده : 181.88 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_ml

  • حجم دانلود : 92.50 KiB

  • حجم مجموعه داده : 165.14 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 687

tatoeba/tatoeba_mr

  • حجم دانلود : 98.19 KiB

  • حجم مجموعه داده : 202.96 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_nl

  • حجم دانلود : 71.55 KiB

  • حجم مجموعه داده : 176.10 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_pt

  • حجم دانلود : 73.42 KiB

  • حجم مجموعه داده : 177.95 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_ru

  • حجم دانلود : 90.30 KiB

  • حجم مجموعه داده : 194.92 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_sw

  • حجم دانلود : 19.99 KiB

  • اندازه مجموعه داده : 60.75 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 390

tatoeba/tatoeba_ta

  • حجم دانلود : 38.52 KiB

  • حجم مجموعه داده : 70.93 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 307

tatoeba/tatoeba_te

  • حجم دانلود : 24.55 KiB

  • اندازه مجموعه داده : 49.07 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 234

tatoeba/tatoeba_th

  • حجم دانلود : 61.72 KiB

  • حجم مجموعه داده : 119.32 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 548

tatoeba/tatoeba_tl

  • حجم دانلود : 66.54 KiB

  • حجم مجموعه داده : 171.04 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_tr

  • حجم دانلود : 70.20 KiB

  • حجم مجموعه داده : 174.70 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_ur

  • حجم دانلود : 86.63 KiB

  • حجم مجموعه داده : 191.20 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_vi

  • حجم دانلود : 89.26 KiB

  • حجم مجموعه داده : 193.89 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000

tatoeba/tatoeba_zh

  • حجم دانلود : 67.32 KiB

  • اندازه مجموعه داده : 171.85 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1000