konuşma_komutları

  • Açıklama :

Anahtar kelime bulma sistemlerini eğitmeye ve değerlendirmeye yardımcı olmak için tasarlanmış, konuşulan sözcüklerden oluşan bir ses veri kümesi. Birincil amacı, arka plan gürültüsünden veya ilgisiz konuşmadan mümkün olduğunca az yanlış pozitif ile on hedef kelimeden oluşan bir setten tek bir kelimenin ne zaman söylendiğini tespit eden küçük modeller oluşturmak ve test etmek için bir yol sağlamaktır. Tren ve doğrulama setinde "bilinmeyen" etiketinin, hedef kelimelerin etiketlerinden veya arka plan gürültüsünden çok daha yaygın olduğuna dikkat edin. Yayın sürümünden bir fark, sessiz bölümlerin işlenmesidir. Test setinde sessizlik segmentleri normal 1 saniyelik dosyalar iken, eğitimde "background_noise" klasörü altında uzun segmentler halinde verilmektedir. Burada bu arka plan gürültüsünü 1 saniyelik kliplere bölüyoruz ve ayrıca dosyalardan birini doğrulama seti için saklıyoruz.

Bölmek örnekler
'test' 4.890
'train' 85.511
'validation' 10.102
  • Özellik yapısı :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int16),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=12),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
ses Ses (Hiçbiri,) int16
etiket SınıfEtiketi int64
  • Alıntı :
@article{speechcommandsv2,
   author = { {Warden}, P.},
    title = "{Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition}",
  journal = {ArXiv e-prints},
  archivePrefix = "arXiv",
  eprint = {1804.03209},
  primaryClass = "cs.CL",
  keywords = {Computer Science - Computation and Language, Computer Science - Human-Computer Interaction},
    year = 2018,
    month = apr,
    url = {https://arxiv.org/abs/1804.03209},
}