Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

гцан

  • Описание :

Набор данных состоит из 1000 звуковых дорожек по 30 секунд каждая. Он содержит 10 жанров, каждый из которых представлен 100 треками. Все треки представляют собой 16-битные монофонические аудиофайлы с частотой 22050 Гц в формате .wav.

Жанры:

  • блюз
  • классический
  • страна
  • дискотека
  • хип-хоп
  • джаз
  • металл
  • поп
  • регги
  • камень

  • Домашняя страница : http://marsyas.info/index.html

  • Исходный код : tfds.audio.gtzan.GTZAN

  • Версии :

    • 1.0.0 (по умолчанию): нет примечаний к выпуску.
  • Размер загрузки : 1.14 GiB

  • Размер набора данных : 3.71 GiB

  • Автоматическое кэширование ( документация ): Нет

  • Сплиты :

Расколоть Примеры
'train' 1000
  • Особенности :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'audio/filename': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • Цитата :
@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}