Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

speech_commands

  • Deskripsi :

Kumpulan data audio dari kata-kata yang diucapkan yang dirancang untuk membantu melatih dan mengevaluasi sistem bercak kata kunci. Tujuan utamanya adalah menyediakan cara untuk membuat dan menguji model kecil yang mendeteksi saat satu kata diucapkan, dari sepuluh kata target, dengan sesedikit mungkin positif palsu dari kebisingan latar belakang atau ucapan yang tidak terkait. Perhatikan bahwa dalam rangkaian pelatihan dan validasi, label "tidak diketahui" jauh lebih umum daripada label kata target atau kebisingan latar belakang. Satu perbedaan dari versi rilisnya adalah penanganan segmen senyap. Sementara di set pengujian, segmen hening adalah file biasa 1 detik, dalam pelatihan disediakan segmen yang panjang di bawah folder "background_noise". Di sini kami membagi kebisingan latar belakang ini menjadi klip 1 detik, dan juga menyimpan salah satu file untuk set validasi.

Membagi Contoh
'test' 4.890
'train' 85.511
'validation' 10.102
  • Fitur :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
})
@article{speechcommandsv2,
   author = { {Warden}, P.},
    title = "{Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition}",
  journal = {ArXiv e-prints},
  archivePrefix = "arXiv",
  eprint = {1804.03209},
  primaryClass = "cs.CL",
  keywords = {Computer Science - Computation and Language, Computer Science - Human-Computer Interaction},
    year = 2018,
    month = apr,
    url = {https://arxiv.org/abs/1804.03209},
}