ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

พูด_ตัวเลข

 • รายละเอียด:

ชุดข้อมูลเสียงของตัวเลขที่พูดฟรี คิดว่า MNIST สำหรับเสียง

ชุดข้อมูลเสียง/คำพูดอย่างง่ายที่ประกอบด้วยการบันทึกตัวเลขที่พูดในไฟล์ wav ที่ 8kHz การบันทึกจะถูกตัดแต่งเพื่อให้มีความเงียบน้อยที่สุดในตอนต้นและตอนท้าย

5 ลำโพง 2,500 บันทึก (50 หลักต่อผู้พูด) การออกเสียงภาษาอังกฤษ

ไฟล์ที่มีชื่อในรูปแบบดังต่อไปนี้: {digitLabel} {speakerName} {} ดัชนี .wav

แยก ตัวอย่าง
'train' 2,500
 • คุณสมบัติ:
FeaturesDict({
  'audio': Audio(shape=(None,), dtype=tf.int64),
  'audio/filename': Text(shape=(), dtype=tf.string),
  'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
 • อ้างอิง:
@ONLINE {Free Spoken Digit Dataset,
  author = "Zohar Jackson",
  title = "Spoken_Digit",
  year  = "2016",
  url  = "https://github.com/Jakobovski/free-spoken-digit-dataset"
}