ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

คำพูด_คำสั่ง

  • รายละเอียด:

ชุดข้อมูลเสียงของคำพูดที่ออกแบบมาเพื่อช่วยฝึกและประเมินระบบการจำแนกคำหลัก เป้าหมายหลักคือการจัดเตรียมวิธีการสร้างและทดสอบแบบจำลองขนาดเล็กที่ตรวจจับเมื่อมีการพูดคำเดียว จากชุดคำเป้าหมายสิบคำ โดยมีผลบวกที่ผิดพลาดน้อยที่สุดจากเสียงพื้นหลังหรือคำพูดที่ไม่เกี่ยวข้อง โปรดทราบว่าในชุดรถไฟและชุดการตรวจสอบ ป้ายกำกับ "ไม่ทราบ" เป็นที่แพร่หลายมากกว่าป้ายกำกับของคำเป้าหมายหรือเสียงพื้นหลัง ความแตกต่างอย่างหนึ่งจากเวอร์ชันรีลีสคือการจัดการเซ็กเมนต์ที่ไม่มีการโต้ตอบ ขณะอยู่ในชุดการทดสอบ ส่วนการเงียบจะเป็นไฟล์ปกติ 1 วินาที ในการฝึกจะมีการแบ่งส่วนแบบยาวไว้ในโฟลเดอร์ "background_noise" ที่นี่เราแบ่งเสียงพื้นหลังเหล่านี้เป็นคลิป 1 วินาทีและเก็บไฟล์ใดไฟล์หนึ่งไว้สำหรับชุดการตรวจสอบ

  • โฮมเพจ: https://arxiv.org/abs/1804.03209

  • รหัสที่มา: tfds.audio.SpeechCommands

  • รุ่น:

    • 0.0.2 (เริ่มต้น): ไม่มีบันทึกประจำรุ่น
  • ขนาดการดาวน์โหลด: 2.37 GiB

  • ขนาดชุด: 8.17 GiB

  • ออโต้แคช ( เอกสาร ): ไม่มี

  • แยก:

แยก ตัวอย่าง
'test' 4,890
'train' 85,511
'validation' 10,102
  • คุณสมบัติ:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
})
  • อ้างอิง:
@article{speechcommandsv2,
   author = { {Warden}, P.},
    title = "{Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition}",
  journal = {ArXiv e-prints},
  archivePrefix = "arXiv",
  eprint = {1804.03209},
  primaryClass = "cs.CL",
  keywords = {Computer Science - Computation and Language, Computer Science - Human-Computer Interaction},
    year = 2018,
    month = apr,
    url = {https://arxiv.org/abs/1804.03209},
}