Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

mowy_komendy

  • opis:

Zbiór danych dźwiękowych wypowiadanych słów, który ma pomóc w szkoleniu i ocenie systemów rozpoznawania słów kluczowych. Jego głównym celem jest zapewnienie sposobu na budowanie i testowanie małych modeli, które wykrywają wypowiadanie pojedynczego słowa, z zestawu dziesięciu słów docelowych, przy jak najmniejszej liczbie fałszywych trafień z szumu tła lub niezwiązanej mowy. Należy zauważyć, że w zestawie pociągu i walidacji etykieta „nieznana” jest znacznie bardziej rozpowszechniona niż etykiety słów docelowych lub szumu tła. Jedną z różnic w stosunku do wersji wydania jest obsługa cichych segmentów. Podczas gdy w zestawie testowym segmenty ciszy są zwykłymi plikami 1-sekundowymi, podczas treningu są one udostępniane jako długie segmenty w folderze „background_noise”. Tutaj dzielimy te szumy tła na 1-sekundowe klipy, a także zachowujemy jeden z plików dla zestawu walidacyjnego.

Podział Przykłady
'test' 4890
'train' 85 511
'validation' 10102
  • Cechy:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
})
  • cytat:
@article{speechcommandsv2,
   author = { {Warden}, P.},
    title = "{Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition}",
  journal = {ArXiv e-prints},
  archivePrefix = "arXiv",
  eprint = {1804.03209},
  primaryClass = "cs.CL",
  keywords = {Computer Science - Computation and Language, Computer Science - Human-Computer Interaction},
    year = 2018,
    month = apr,
    url = {https://arxiv.org/abs/1804.03209},
}