ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

paws_x_wiki

 • รายละเอียด:

ชุดข้อมูลนี้ประกอบด้วยคู่การประเมิน PAWS ที่แปลโดยมนุษย์ 23,659 คู่และคู่การฝึกอบรมที่แปลด้วยเครื่อง 296,406 คู่ในหกภาษาที่แตกต่างกันตามตัวอักษร:

 • ภาษาฝรั่งเศส
 • สเปน
 • เยอรมัน
 • ภาษาจีน
 • ญี่ปุ่น
 • เกาหลี

สำหรับรายละเอียดเพิ่มเติมโปรดดูที่กระดาษที่มาพร้อมกับ: อุ้งเท้า-X: ข้ามภาษาขัดแย้งชุดข้อมูลสำหรับการแปลความหมายประจำตัวประชาชนที่ https://arxiv.org/abs/1908.11828

เช่นเดียวกับชุดข้อมูล PAWS ตัวอย่างจะแบ่งออกเป็นส่วนการฝึก/พัฒนา/ทดสอบ ไฟล์ทั้งหมดอยู่ในรูปแบบ tsv โดยมีสี่คอลัมน์:

id รหัสเฉพาะสำหรับแต่ละคู่ ประโยค1 ประโยคประโยคแรก2 ประโยคที่สอง (noisy_) ป้ายกำกับ (Noisy) สำหรับแต่ละคู่

แต่ละป้ายกำกับมีค่าที่เป็นไปได้สองค่า: 0 ระบุว่าทั้งคู่มีความหมายต่างกัน ในขณะที่ 1 ระบุว่าทั้งคู่เป็นการถอดความ

FeaturesDict({
  'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
  'sentence1': Text(shape=(), dtype=tf.string),
  'sentence2': Text(shape=(), dtype=tf.string),
})
 • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

 • รูป ( tfds.show_examples ): ไม่ได้รับการสนับสนุน

 • อ้างอิง:

@InProceedings{pawsx2019emnlp,
 title = { {PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification} },
 author = {Yang, Yinfei and Zhang, Yuan and Tar, Chris and Baldridge, Jason},
 booktitle = {Proc. of EMNLP},
 year = {2019}
}

paws_x_wiki/de (การกำหนดค่าเริ่มต้น)

 • คำอธิบาย Config: แปล de

 • ขนาดชุด: 15.27 MiB

 • แยก:

แยก ตัวอย่าง
'test' 2,000
'train' 49,380
'validation' 2,000

paws_x_wiki/th

 • คำอธิบาย Config: แปล en

 • ขนาดชุด: 14.59 MiB

 • แยก:

แยก ตัวอย่าง
'test' 2,000
'train' 49,175
'validation' 2,000

paws_x_wiki/es

 • คำอธิบาย Config: แปล ES

 • ขนาดชุด: 15.27 MiB

 • แยก:

แยก ตัวอย่าง
'test' 2,000
'train' 49,401
'validation' 1,961

paws_x_wiki/fr

 • คำอธิบาย Config: แปลเ

 • ขนาดชุด: 15.79 MiB

 • แยก:

แยก ตัวอย่าง
'test' 2,000
'train' 49,399
'validation' 1,988

paws_x_wiki/ja

 • คำอธิบาย Config: แปล ja

 • ขนาดชุด: 17.77 MiB

 • แยก:

แยก ตัวอย่าง
'test' 2,000
'train' 49,401
'validation' 2,000

paws_x_wiki/ko

 • คำอธิบาย Config: แปลไปยังเกาะ

 • ขนาดชุด: 16.42 MiB

 • แยก:

แยก ตัวอย่าง
'test' 1,999
'train' 49,164
'validation' 2,000

paws_x_wiki/zh

 • คำอธิบาย Config: แปล zh

 • ขนาดชุด: 13.20 MiB

 • แยก:

แยก ตัวอย่าง
'test' 2,000
'train' 49,401
'validation' 2,000