O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

gtzan

  • Descrição:

O conjunto de dados consiste em 1000 faixas de áudio, cada uma com 30 segundos de duração. Ele contém 10 gêneros, cada um representado por 100 faixas. Todas as faixas são arquivos de áudio Mono 16 bits de 22050 Hz no formato .wav.

Os gêneros são:

Dividir Exemplos
'train' 1.000
  • Características:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'audio/filename': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • citação:
@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}