ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

พูด_ตัวเลข

  • รายละเอียด:

ชุดข้อมูลเสียงของตัวเลขที่พูดฟรี คิดว่า MNIST สำหรับเสียง

ชุดข้อมูลเสียง/คำพูดอย่างง่ายที่ประกอบด้วยการบันทึกตัวเลขที่พูดในไฟล์ wav ที่ 8kHz การบันทึกจะถูกตัดแต่งเพื่อให้มีความเงียบน้อยที่สุดในตอนต้นและตอนท้าย

5 ลำโพง 2,500 บันทึก (50 หลักต่อผู้พูด) การออกเสียงภาษาอังกฤษ

ไฟล์ที่มีชื่อในรูปแบบดังต่อไปนี้: {digitLabel} {speakerName} {} ดัชนี .wav

แยก ตัวอย่าง
'train' 2,500
  • คุณสมบัติ:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'audio/filename': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • อ้างอิง:
@ONLINE {Free Spoken Digit Dataset,
    author = "Zohar Jackson",
    title  = "Spoken_Digit",
    year   = "2016",
    url    = "https://github.com/Jakobovski/free-spoken-digit-dataset"
}