امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

gtzan

 • توضیحات :

مجموعه داده شامل 1000 قطعه صوتی به طول 30 ثانیه است. این شامل 10 ژانر است که هرکدام با 100 قطعه نمایش داده می شوند. آهنگ ها همه فایل های صوتی مانیو 16 بیتی 22050Hz با فرمت .wav هستند.

ژانرها عبارتند از:

 • بلوز
 • کلاسیک
 • کشور
 • دیسکو
 • هیپ هاپ
 • جاز
 • فلز
 • ترکیدن
 • رگی
 • سنگ

 • صفحه اصلی : http://marsyas.info/index.html

 • کد منبع : tfds.audio.gtzan.GTZAN

 • نسخه ها :

  • 1.0.0 (پیش فرض): بدون یادداشت انتشار.
 • اندازه بارگیری : 1.14 GiB

 • اندازه مجموعه داده : 3.71 GiB

 • ذخیره خودکار ( مستندات ): خیر

 • تقسیم :

شکاف مثال ها
'train' 1000
 • ویژگی ها :
FeaturesDict({
  'audio': Audio(shape=(None,), dtype=tf.int64),
  'audio/filename': Text(shape=(), dtype=tf.string),
  'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
 • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('audio', 'label')

 • نقل قول :

@misc{tzanetakis_essl_cook_2001,
author  = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title   = "Automatic Musical Genre Classification Of Audio Signals",
url    = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year   = "2001"
}