para_crawl

  • คำอธิบาย :

Web-Scale Parallel Corpora สำหรับภาษาทางการของยุโรป

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl/enbg (การกำหนดค่าเริ่มต้น)

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น bg

  • ขนาดการดาวน์โหลด : 98.94 MiB

  • ขนาดชุดข้อมูล : 362.46 MiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 1,039,885
  • โครงสร้างคุณลักษณะ :
Translation({
    'bg': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
บีจี ข้อความ สตริง
th ข้อความ สตริง

para_crawl/encs

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น cs

  • ขนาดการดาวน์โหลด : 187.31 MiB

  • ขนาดชุดข้อมูล : 666.34 MiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 2,981,949
  • โครงสร้างคุณลักษณะ :
Translation({
    'cs': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
ข้อความ สตริง
th ข้อความ สตริง

para_crawl/enda

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษาดา

  • ขนาดการดาวน์โหลด : 174.34 MiB

  • ขนาดชุดข้อมูล : 619.77 MiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 2,414,895
  • โครงสร้างคุณลักษณะ :
Translation({
    'da': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
ดา ข้อความ สตริง
th ข้อความ สตริง

para_crawl/สิ้นสุด

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษาเด

  • ขนาดการดาวน์โหลด : 1.22 GiB

  • ขนาดชุดข้อมูล : 4.04 GiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 16,264,448
  • โครงสร้างคุณลักษณะ :
Translation({
    'de': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
เดอ ข้อความ สตริง
th ข้อความ สตริง

para_crawl/enel

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นเอล

  • ขนาดการดาวน์โหลด : 184.59 MiB

  • ขนาดชุดข้อมูล : 698.75 MiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 1,985,233
  • โครงสร้างคุณลักษณะ :
Translation({
    'el': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
เอล ข้อความ สตริง
th ข้อความ สตริง

para_crawl/enes

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น es

  • ขนาดการดาวน์โหลด : 1.82 GiB

  • ขนาดชุดข้อมูล : 6.23 GiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 21,987,267
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'es': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
อี ข้อความ สตริง

para_crawl/enet

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น et

  • ขนาดการดาวน์โหลด : 66.91 MiB

  • ขนาดชุดข้อมูล : 209.16 MiB

  • แคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ shuffle_files=False (รถไฟ)

  • แยก :

แยก ตัวอย่าง
'train' 853,422
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'et': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
เป็นต้น ข้อความ สตริง

para_crawl/enfi

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น fi

  • ขนาดการดาวน์โหลด : 151.83 MiB

  • ขนาดชุดข้อมูล : 543.85 MiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 2,156,069
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'fi': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
ไฟ ข้อความ สตริง

para_crawl/enfr

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษาฝรั่งเศส

  • ขนาดการดาวน์โหลด : 2.63 GiB

  • ขนาดชุดข้อมูล : 9.04 GiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 31,374,161
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'fr': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
fr ข้อความ สตริง

para_crawl/enga

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น ga

  • ขนาดการดาวน์โหลด : 28.03 MiB

  • ขนาดชุดข้อมูล : 107.09 MiB

  • แคชอัตโนมัติ ( เอกสาร ): ใช่

  • แยก :

แยก ตัวอย่าง
'train' 357,399
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'ga': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
กา ข้อความ สตริง

para_crawl/enhr

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นชั่วโมง

  • ขนาดการดาวน์โหลด : 80.97 MiB

  • ขนาดชุดข้อมูล : 256.37 MiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 1,002,053
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'hr': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
ชม ข้อความ สตริง

para_crawl/enhu

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น hu

  • ขนาดการดาวน์โหลด : 114.24 MiB

  • ขนาดชุดข้อมูล : 421.40 MiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 1,901,342
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'hu': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
ข้อความ สตริง

para_crawl/enit

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น

  • ขนาดการดาวน์โหลด : 1017.30 MiB

  • ขนาดชุดข้อมูล : 3.36 GiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 12,162,239
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'it': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
มัน ข้อความ สตริง

para_crawl/enlt

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น lt

  • ขนาดการดาวน์โหลด : 63.28 MiB

  • ขนาดชุดข้อมูล : 204.70 MiB

  • แคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ shuffle_files=False (รถไฟ)

  • แยก :

แยก ตัวอย่าง
'train' 844,643
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'lt': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
ร.ท ข้อความ สตริง

para_crawl/enlv

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น lv

  • ขนาดการดาวน์โหลด : 45.17 MiB

  • ขนาดชุดข้อมูล : 147.09 MiB

  • แคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ shuffle_files=False (รถไฟ)

  • แยก :

แยก ตัวอย่าง
'train' 553,060
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'lv': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
เลเวล ข้อความ สตริง

para_crawl/enmt

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภูเขา

  • ขนาดการดาวน์โหลด : 18.15 MiB

  • ขนาดชุดข้อมูล : 54.36 MiB

  • แคชอัตโนมัติ ( เอกสาร ): ใช่

  • แยก :

แยก ตัวอย่าง
'train' 195,502
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'mt': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
ภูเขา ข้อความ สตริง

para_crawl/ennl

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น nl

  • ขนาดการดาวน์โหลด : 400.63 MiB

  • ขนาดชุดข้อมูล : 1.40 GiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 5,659,268
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'nl': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
nl ข้อความ สตริง

para_crawl/enpl

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น pl

  • ขนาดการดาวน์โหลด : 257.90 MiB

  • ขนาดชุดข้อมูล : 885.63 MiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 3,503,276
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'pl': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
กรุณา ข้อความ สตริง

para_crawl/enpt

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น pt

  • ขนาดการดาวน์โหลด : 608.62 MiB

  • ขนาดชุดข้อมูล : 2.05 GiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 8,141,940
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
ข้อความ สตริง

para_crawl/enro

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น ro

  • ขนาดการดาวน์โหลด : 153.24 MiB

  • ขนาดชุดข้อมูล : 534.34 MiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 1,952,043
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'ro': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
ro ข้อความ สตริง

para_crawl/ensk

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษา sk

  • ขนาดการดาวน์โหลด : 96.61 MiB

  • ขนาดชุดข้อมูล : 352.91 MiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 1,591,831
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'sk': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
สก ข้อความ สตริง

para_crawl/ensl

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น sl

  • ขนาดการดาวน์โหลด : 62.02 MiB

  • ขนาดชุดข้อมูล : 187.66 MiB

  • แคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ shuffle_files=False (รถไฟ)

  • แยก :

แยก ตัวอย่าง
'train' 660,161
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'sl': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
ข้อความ สตริง

para_crawl/ensv

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น sv

  • ขนาดการดาวน์โหลด : 262.76 MiB

  • ขนาดชุดข้อมูล : 905.72 MiB

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'train' 3,476,729
  • โครงสร้างคุณลักษณะ :
Translation({
    'en': Text(shape=(), dtype=string),
    'sv': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
แปล
th ข้อความ สตริง
sv ข้อความ สตริง