gtzan_music_speech

Descriptif :

L'ensemble de données a été collecté à des fins de discrimination par la musique/la parole. L'ensemble de données se compose de 120 pistes, chacune d'une durée de 30 secondes. Chaque classe (musique/parole) a 60 exemples. Les pistes sont toutes des fichiers audio 22050 Hz Mono 16 bits au format .wav.

Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : http://marsyas.info/index.html
Code source : tfds.audio.gtzan_music_speech.GTZANMusicSpeech
Versions :
- 1.0.0 (par défaut) : aucune note de version.
Taille du téléchargement : 283.29 MiB
Taille du jeu de données : 424.64 MiB
Mise en cache automatique ( documentation ): Non
Fractionnements :

Diviser	Exemples
`'train'`	128

Structure des fonctionnalités :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

Documentation des fonctionnalités :

Caractéristique	Classer	Forme	Dtype
	FonctionnalitésDict
l'audio	l'audio	(Aucun,)	int64
audio/nom de fichier	Texte		chaîne de caractères
étiquette	Étiquette de classe		int64

Touches supervisées (Voir as_supervised doc ): ('audio', 'label')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):

Citation :

@ONLINE {Music Speech,
    author = "Tzanetakis, George",
    title  = "GTZAN Music/Speech Collection",
    year   = "1999",
    url    = "http://marsyas.info/index.html"
}

gtzan_music_speech Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

gtzan_music_speech