konuşma_komutları

  • Açıklama :

Anahtar kelime tespit sistemlerini eğitmeye ve değerlendirmeye yardımcı olmak için tasarlanmış sözlü kelimelerden oluşan bir ses veri seti. Birincil amacı, arka plan gürültüsünden veya alakasız konuşmalardan mümkün olduğunca az yanlış pozitif ile, on hedef kelimeden oluşan tek bir kelimenin söylendiğini algılayan küçük modeller oluşturmak ve test etmek için bir yol sağlamaktır. Tren ve doğrulama kümesinde, "bilinmeyen" etiketinin, hedef sözcüklerin veya arka plan gürültüsünün etiketlerinden çok daha yaygın olduğunu unutmayın. Yayın sürümünden bir fark, sessiz bölümlerin işlenmesidir. Test setinde sessiz segmentler normal 1 saniyelik dosyalar iken, eğitimde "background_noise" klasörü altında uzun segmentler olarak verilmektedir. Burada bu arka plan gürültüsünü 1 saniyelik kliplere böldük ve ayrıca doğrulama seti için dosyalardan birini tutuyoruz.

Bölmek Örnekler
'test' 4.890
'train' 85.511
'validation' 10,102
  • Özellikler :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
})
  • alıntı :
@article{speechcommandsv2,
   author = { {Warden}, P.},
    title = "{Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition}",
  journal = {ArXiv e-prints},
  archivePrefix = "arXiv",
  eprint = {1804.03209},
  primaryClass = "cs.CL",
  keywords = {Computer Science - Computation and Language, Computer Science - Human-Computer Interaction},
    year = 2018,
    month = apr,
    url = {https://arxiv.org/abs/1804.03209},
}