gtzan

  • Description:

L'ensemble de données se compose de 1000 pistes audio d'une durée de 30 secondes. Il contient 10 genres, chacun représenté par 100 pistes. Les pistes sont toutes des fichiers audio mono 16 bits à 22050 Hz au format .wav.

Les genres sont :

  • bleus
  • classique
  • pays
  • disco
  • hip hop
  • le jazz
  • métal
  • pop
  • reggae
  • Roche

  • Page d' accueil: http://marsyas.info/index.html

  • Code source: tfds.audio.gtzan.GTZAN

  • versions:

    • 1.0.0 (par défaut): Aucune note de version.
  • Taille du téléchargement: 1.14 GiB

  • Taille Dataset: 3.71 GiB

  • Mis en cache automatique ( documentation ): Non

  • scissions:

Diviser Exemples
'train' 1 000
  • Caractéristiques:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'audio/filename': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • citation:
@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}