konuşma_komutları

Açıklama :

Anahtar kelime bulma sistemlerini eğitmeye ve değerlendirmeye yardımcı olmak için tasarlanmış, konuşulan sözcüklerden oluşan bir ses veri kümesi. Birincil amacı, arka plan gürültüsünden veya ilgisiz konuşmadan mümkün olduğunca az yanlış pozitif ile on hedef kelimeden oluşan bir setten tek bir kelimenin ne zaman söylendiğini tespit eden küçük modeller oluşturmak ve test etmek için bir yol sağlamaktır. Tren ve doğrulama setinde "bilinmeyen" etiketinin, hedef kelimelerin etiketlerinden veya arka plan gürültüsünden çok daha yaygın olduğuna dikkat edin. Yayın sürümünden bir fark, sessiz bölümlerin işlenmesidir. Test setinde sessizlik segmentleri normal 1 saniyelik dosyalar iken, eğitimde "background_noise" klasörü altında uzun segmentler halinde verilmektedir. Burada bu arka plan gürültüsünü 1 saniyelik kliplere bölüyoruz ve ayrıca dosyalardan birini doğrulama seti için saklıyoruz.

Ek Belgeler : Belgeleri Keşfedin
Anasayfa : https://arxiv.org/abs/1804.03209
Kaynak kodu : tfds.datasets.speech_commands.Builder
sürümler :
- 0.0.3 (varsayılan): Ses veri türünü dtype=tf.int16 ile düzeltin.
İndirme boyutu : 2.37 GiB
Veri kümesi boyutu : 8.17 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :

Bölmek	örnekler
`'test'`	4.890
`'train'`	85.511
`'validation'`	10.102

Özellik yapısı :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int16),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=12),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
ses	Ses	(Hiçbiri,)	int16
etiket	SınıfEtiketi		int64

Denetlenen tuşlar (Bkz as_supervised doc ): ('audio', 'label')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):

Alıntı :

@article{speechcommandsv2,
   author = { {Warden}, P.},
    title = "{Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition}",
  journal = {ArXiv e-prints},
  archivePrefix = "arXiv",
  eprint = {1804.03209},
  primaryClass = "cs.CL",
  keywords = {Computer Science - Computation and Language, Computer Science - Human-Computer Interaction},
    year = 2018,
    month = apr,
    url = {https://arxiv.org/abs/1804.03209},
}

konuşma_komutları Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.

konuşma_komutları