Bantuan melindungi Great Barrier Reef dengan TensorFlow pada Kaggle Bergabung Tantangan

ucapan_perintah

  • Keterangan:

Kumpulan data audio dari kata-kata yang diucapkan yang dirancang untuk membantu melatih dan mengevaluasi sistem pencarian kata kunci. Tujuan utamanya adalah menyediakan cara untuk membangun dan menguji model kecil yang mendeteksi ketika satu kata diucapkan, dari sepuluh kata target, dengan sesedikit mungkin kesalahan positif dari kebisingan latar belakang atau ucapan yang tidak terkait. Perhatikan bahwa dalam rangkaian rangkaian dan validasi, label "tidak diketahui" jauh lebih umum daripada label kata-kata target atau kebisingan latar belakang. Salah satu perbedaan dari versi rilis adalah penanganan segmen diam. Sementara di set tes segmen diam adalah file 1 detik biasa, dalam pelatihan mereka disediakan sebagai segmen panjang di bawah folder "background_noise". Di sini kami membagi kebisingan latar belakang ini menjadi klip 1 detik, dan juga menyimpan salah satu file untuk set validasi.

Membelah Contoh
'test' 4.890
'train' 85.511
'validation' 10.102
  • fitur:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
})
  • Citation:
@article{speechcommandsv2,
   author = { {Warden}, P.},
    title = "{Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition}",
  journal = {ArXiv e-prints},
  archivePrefix = "arXiv",
  eprint = {1804.03209},
  primaryClass = "cs.CL",
  keywords = {Computer Science - Computation and Language, Computer Science - Human-Computer Interaction},
    year = 2018,
    month = apr,
    url = {https://arxiv.org/abs/1804.03209},
}