voxforge

  • Açıklama:

VoxForge bir dil sınıflandırma veri setidir. Web sitesine gönderilen, kullanıcı tarafından gönderilen ses kliplerinden oluşur. Bu sürümde 6 dilden veriler toplanmıştır - İngilizce, İspanyolca, Fransızca, Almanca, Rusça ve İtalyanca. Web sitesi sürekli güncellendiğinden ve tekrarlanabilirlik adına bu sürüm yalnızca 2020-01-01 tarihinden önce gönderilen kayıtları içerir. Numuneler, her bir konuşmacıdan alınan numunelerin tam olarak bir bölmeye ait olması için eğitim, doğrulama ve test arasında bölünür.

  • Anasayfa: http://www.voxforge.org/

  • Kaynak kodu: tfds.audio.Voxforge

  • sürümleri:

    • 1.0.0 (varsayılan): Hayır sürüm notları.
  • İndirme boyutu: Unknown size

  • Veri kümesi boyutu: Unknown size

  • Manuel indirme talimatları: Bu veri kümesi içine elle kaynak verileri indirmenizi gerektirir download_config.manual_dir (varsayılan olarak ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge, ses arşivlerinin manuel olarak indirilmesini gerektirir. Arşivlerin tam listesi bulunabilir https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt wget -i voxforge_urls.txt -x Not indirilmesi olduğunu: Aşağıdaki komutu kullanarak indirilebilir ve veri kümesini yerel olarak oluşturmak ~100GB disk alanı gerektirir (ancak yalnızca ~60GB kalıcı olarak kullanılacaktır).

  • Otomatik önbelleğe ( dokümantasyon ): Bilinmeyen

  • Splits:

Bölünmüş Örnekler
  • Özellikler:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}