voxforge

  • opis :

VoxForge to zestaw danych do klasyfikacji języków. Składa się z przesłanych przez użytkowników klipów audio przesłanych na stronę internetową. W tej wersji gromadzone są dane z 6 języków — angielskiego, hiszpańskiego, francuskiego, niemieckiego, rosyjskiego i włoskiego. Ponieważ witryna jest stale aktualizowana i ze względu na powtarzalność, niniejsze wydanie zawiera tylko nagrania przesłane przed 2020-01-01. Próbki są dzielone między pociąg, walidację i testowanie, tak aby próbki z każdego mówcy należały dokładnie do jednego podziału.

  • Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na

  • Strona główna : http://www.voxforge.org/

  • Kod źródłowy : tfds.audio.Voxforge

  • Wersje :

    • 1.0.0 (domyślnie): Brak informacji o wersji.
  • Rozmiar pliku do pobrania : Unknown size

  • Rozmiar zbioru danych : Unknown size

  • Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do katalogu download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge wymaga ręcznego pobrania archiwów audio. Pełną listę archiwów można znaleźć pod adresem https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Można je pobrać za pomocą następującego polecenia: wget -i voxforge_urls.txt -x Należy pamiętać, że pobieranie a budowanie zbioru danych lokalnie wymaga około 100 GB miejsca na dysku (ale tylko około 60 GB będzie używane na stałe).

  • Automatyczne buforowanie ( dokumentacja ): Nieznane

  • Podziały :

Rozdzielać Przykłady
  • Struktura funkcji :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
audio Audio (Nic,) int64
etykieta Etykieta klasy int64
identyfikator_mówcy Napinacz strunowy
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}