- Açıklama:
VoxForge bir dil sınıflandırma veri setidir. Web sitesine gönderilen, kullanıcı tarafından gönderilen ses kliplerinden oluşur. Bu sürümde 6 dilden veriler toplanmıştır - İngilizce, İspanyolca, Fransızca, Almanca, Rusça ve İtalyanca. Web sitesi sürekli güncellendiğinden ve tekrarlanabilirlik adına bu sürüm yalnızca 2020-01-01 tarihinden önce gönderilen kayıtları içerir. Numuneler, her bir konuşmacıdan alınan numunelerin tam olarak bir bölmeye ait olması için eğitim, doğrulama ve test arasında bölünür.
Anasayfa: http://www.voxforge.org/
Kaynak kodu:
tfds.audio.Voxforge
sürümleri:
-
1.0.0
(varsayılan): Hayır sürüm notları.
-
İndirme boyutu:
Unknown size
Veri kümesi boyutu:
Unknown size
Manuel indirme talimatları: Bu veri kümesi içine elle kaynak verileri indirmenizi gerektirir
download_config.manual_dir
(varsayılan olarak~/tensorflow_datasets/downloads/manual/
):
VoxForge, ses arşivlerinin manuel olarak indirilmesini gerektirir. Arşivlerin tam listesi bulunabilir https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt wget -i voxforge_urls.txt -x Not indirilmesi olduğunu: Aşağıdaki komutu kullanarak indirilebilir ve veri kümesini yerel olarak oluşturmak ~100GB disk alanı gerektirir (ancak yalnızca ~60GB kalıcı olarak kullanılacaktır).Otomatik önbelleğe ( dokümantasyon ): Bilinmeyen
Splits:
Bölünmüş | Örnekler |
---|
- Özellikler:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'speaker_id': tf.string,
})
Denetimli tuşları (Bkz
as_supervised
doc ):('audio', 'label')
Şekil ( tfds.show_examples ): desteklenmez.
Örnekler ( tfds.as_dataframe ): eksik.
Citation:
@article{maclean2018voxforge,
title={Voxforge},
author={MacLean, Ken},
journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
year={2018}
}