tatoeba

  • คำอธิบาย :

ข้อมูลนี้ดึงมาจาก Tatoeba corpus ลงวันที่ 11/2018/11/17

สำหรับแต่ละภาษา เราได้เลือก 1,000 ประโยคภาษาอังกฤษและคำแปล ถ้ามี โปรดตรวจสอบเอกสารนี้เพื่อดูคำอธิบายของภาษา ตระกูลและสคริปต์ รวมทั้งผลลัพธ์พื้นฐาน

โปรดทราบว่าประโยคภาษาอังกฤษนั้นไม่เหมือนกันสำหรับทุกคู่ภาษา ซึ่งหมายความว่าผลลัพธ์จะไม่สามารถเปรียบเทียบได้โดยตรงในภาษาต่างๆ

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
source_language ข้อความ สตริง
source_sentence ข้อความ สตริง
ภาษาเป้าหมาย ข้อความ สตริง
target_sentence ข้อความ สตริง
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

  • รูปภาพ ( tfds.show_examples ): ไม่รองรับ

  • การอ้างอิง :

@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba/tatoeba_af (การกำหนดค่าเริ่มต้น)

  • ขนาดการดาวน์โหลด : 58.24 KiB

  • ขนาดชุดข้อมูล : 162.74 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_ar

  • ขนาดการดาวน์โหลด : 70.95 KiB

  • ขนาดชุดข้อมูล : 175.46 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_bg

  • ขนาดการดาวน์โหลด : 99.88 KiB

  • ขนาดชุดข้อมูล : 204.64 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_bn

  • ขนาดการดาวน์โหลด : 89.55 KiB

  • ขนาดชุดข้อมูล : 194.24 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_de

  • ขนาดการดาวน์โหลด : 103.09 KiB

  • ขนาดชุดข้อมูล : 207.93 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_el

  • ขนาดการดาวน์โหลด : 77.11 KiB

  • ขนาดชุดข้อมูล : 181.65 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_es

  • ขนาดการดาวน์โหลด : 70.57 KiB

  • ขนาดชุดข้อมูล : 175.12 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_et

  • ขนาดการดาวน์โหลด : 58.33 KiB

  • ขนาดชุดข้อมูล : 162.85 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_eu

  • ขนาดการดาวน์โหลด : 64.52 KiB

  • ขนาดชุดข้อมูล : 169.02 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_fa

  • ขนาดการดาวน์โหลด : 91.52 KiB

  • ขนาดชุดข้อมูล : 196.15 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_fi

  • ขนาดการดาวน์โหลด : 73.90 KiB

  • ขนาดชุดข้อมูล : 178.47 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_fr

  • ขนาดการดาวน์โหลด : 78.14 KiB

  • ขนาดชุดข้อมูล : 182.68 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_he

  • ขนาดการดาวน์โหลด : 81.54 KiB

  • ขนาดชุดข้อมูล : 186.15 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_hi

  • ขนาดการดาวน์โหลด : 119.69 KiB

  • ขนาดชุดข้อมูล : 224.89 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_hu

  • ขนาดการดาวน์โหลด : 67.27 KiB

  • ขนาดชุดข้อมูล : 171.78 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_id

  • ขนาดการดาวน์โหลด : 73.09 KiB

  • ขนาดชุดข้อมูล : 177.61 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_it

  • ขนาดการดาวน์โหลด : 64.29 KiB

  • ขนาดชุดข้อมูล : 168.81 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_ja

  • ขนาดการดาวน์โหลด : 90.90 KiB

  • ขนาดชุดข้อมูล : 195.53 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_jv

  • ขนาดการดาวน์โหลด : 13.59 KiB

  • ขนาดชุดข้อมูล : 35.01 KiB

  • แยก :

แยก ตัวอย่าง
'train' 205

tatoeba/tatoeba_ka

  • ขนาดการดาวน์โหลด : 70.47 KiB

  • ขนาดชุดข้อมูล : 148.67 KiB

  • แยก :

แยก ตัวอย่าง
'train' 746

tatoeba/tatoeba_kk

  • ขนาดการดาวน์โหลด : 46.07 KiB

  • ขนาดชุดข้อมูล : 106.25 KiB

  • แยก :

แยก ตัวอย่าง
'train' 575

tatoeba/tatoeba_ko

  • ขนาดการดาวน์โหลด : 77.28 KiB

  • ขนาดชุดข้อมูล : 181.88 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_ml

  • ขนาดการดาวน์โหลด : 92.50 KiB

  • ขนาดชุดข้อมูล : 165.14 KiB

  • แยก :

แยก ตัวอย่าง
'train' 687

tatoeba/tatoeba_mr

  • ขนาดการดาวน์โหลด : 98.19 KiB

  • ขนาดชุดข้อมูล : 202.96 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_nl

  • ขนาดการดาวน์โหลด : 71.55 KiB

  • ขนาดชุดข้อมูล : 176.10 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_pt

  • ขนาดการดาวน์โหลด : 73.42 KiB

  • ขนาดชุดข้อมูล : 177.95 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_ru

  • ขนาดการดาวน์โหลด : 90.30 KiB

  • ขนาดชุดข้อมูล : 194.92 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_sw

  • ขนาดการดาวน์โหลด : 19.99 KiB

  • ขนาดชุดข้อมูล : 60.75 KiB

  • แยก :

แยก ตัวอย่าง
'train' 390

tatoeba/tatoeba_ta

  • ขนาดการดาวน์โหลด : 38.52 KiB

  • ขนาดชุดข้อมูล : 70.93 KiB

  • แยก :

แยก ตัวอย่าง
'train' 307

tatoeba/tatoeba_te

  • ขนาดการดาวน์โหลด : 24.55 KiB

  • ขนาดชุดข้อมูล : 49.07 KiB

  • แยก :

แยก ตัวอย่าง
'train' 234

tatoeba/tatoeba_th

  • ขนาดการดาวน์โหลด : 61.72 KiB

  • ขนาดชุดข้อมูล : 119.32 KiB

  • แยก :

แยก ตัวอย่าง
'train' 548

tatoeba/tatoeba_tl

  • ขนาดการดาวน์โหลด : 66.54 KiB

  • ขนาดชุดข้อมูล : 171.04 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_tr

  • ขนาดการดาวน์โหลด : 70.20 KiB

  • ขนาดชุดข้อมูล : 174.70 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_ur

  • ขนาดการดาวน์โหลด : 86.63 KiB

  • ขนาดชุดข้อมูล : 191.20 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_vi

  • ขนาดการดาวน์โหลด : 89.26 KiB

  • ขนาดชุดข้อมูล : 193.89 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000

tatoeba/tatoeba_zh

  • ขนาดการดาวน์โหลด : 67.32 KiB

  • ขนาดชุดข้อมูล : 171.85 KiB

  • แยก :

แยก ตัวอย่าง
'train' 1,000