ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

บทประพันธ์

 • รายละเอียด:

OPUS คือชุดของข้อความที่แปลจากเว็บ

สร้างการกำหนดค่าของคุณเองเพื่อเลือกคู่ข้อมูล/ภาษาที่จะโหลด

config = tfds.translate.opus.OpusConfig(
  version=tfds.core.Version('0.1.0'),
  language_pair=("de", "en"),
  subsets=["GNOME", "EMEA"]
)
builder = tfds.builder("opus", config=config)
 • โฮมเพจ: http://opus.nlpl.eu/

 • รหัสที่มา: tfds.translate.Opus

 • รุ่น:

  • 0.1.0 (เริ่มต้น): ไม่มีบันทึกประจำรุ่น
 • คุณสมบัติ:

Translation({
  'de': Text(shape=(), dtype=tf.string),
  'en': Text(shape=(), dtype=tf.string),
})
 • คีย์ภายใต้การดูแล (ดู as_supervised doc ): ('de', 'en')

 • รูป ( tfds.show_examples ): ไม่ได้รับการสนับสนุน

 • อ้างอิง:

@inproceedings{Tiedemann2012ParallelData,
 author = {Tiedemann, J},
 title = {Parallel Data, Tools and Interfaces in OPUS},
 booktitle = {LREC}
 year = {2012} }

บทประพันธ์/การแพทย์ (การกำหนดค่าเริ่มต้น)

 • คำอธิบาย Config: เอกสารทางการแพทย์

 • ขนาดการดาวน์โหลด: 34.29 MiB

 • ขนาดชุด: 188.85 MiB

 • ออโต้แคช ( เอกสาร ): เฉพาะเมื่อ shuffle_files=False (รถไฟ)

 • แยก:

แยก ตัวอย่าง
'train' 1,108,752

บทประพันธ์/กฎหมาย

 • คำอธิบาย Config: เอกสารกฎหมาย

 • ขนาดการดาวน์โหลด: 46.99 MiB

 • ขนาดชุด: 214.44 MiB

 • ออโต้แคช ( เอกสาร ): เฉพาะเมื่อ shuffle_files=False (รถไฟ)

 • แยก:

แยก ตัวอย่าง
'train' 719,372

บทประพันธ์/อัลกุรอาน

 • คำอธิบาย Config: เอกสารอัลกุรอาน

 • ขนาดการดาวน์โหลด: 35.42 MiB

 • ขนาดชุด: 117.54 MiB

 • ออโต้แคช ( เอกสาร ): ใช่

 • แยก:

แยก ตัวอย่าง
'train' 537,128

บทประพันธ์/ไอที

 • คำอธิบาย Config: เอกสารไอที

 • ขนาดการดาวน์โหลด: 10.33 MiB

 • ขนาดชุด: 42.51 MiB

 • ออโต้แคช ( เอกสาร ): ใช่

 • แยก:

แยก ตัวอย่าง
'train' 347,817

บทประพันธ์/คำบรรยาย

 • คำอธิบาย Config: เอกสารคำบรรยาย

 • ขนาดการดาวน์โหลด: 677.64 MiB

 • ขนาดชุด: 2.01 GiB

 • ออโต้แคช ( เอกสาร ): ไม่มี

 • แยก:

แยก ตัวอย่าง
'train' 22,512,639