Эта страница была переведа с помощью Cloud Translation API.
Switch to English

gtzan

  • Описание :

Набор данных состоит из 1000 звуковых дорожек каждые 30 секунд. Он содержит 10 жанров, каждый из которых представлен по 100 треков. Все дорожки представляют собой моно 16-битные аудиофайлы 22050 Гц в формате .wav.

Жанры:

  • блюз
  • классический
  • страна
  • дискотека
  • хип-хоп
  • джаз
  • металл
  • поп
  • регги
  • рок

  • Домашняя страница : http://marsyas.info/index.html

  • Исходный код : tfds.audio.gtzan.GTZAN

  • Версии :

    • 1.0.0 (по умолчанию): без примечаний к выпуску.
  • Размер загружаемого файла : 1.14 GiB

  • Размер набора данных : 3.71 GiB

  • Автоматическое кэширование ( документация ): Нет

  • Сплит :

Трещина Примеры
'train' 1,000
  • Особенности :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'audio/filename': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • Контролируемые ключи (см. as_supervised doc ): ('audio', 'label')

  • Цитата :

@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}