- توضیحات :
مجموعه داده شامل 1000 قطعه صوتی به طول 30 ثانیه است. این شامل 10 ژانر است که هرکدام با 100 قطعه نمایش داده می شوند. آهنگ ها همه فایل های صوتی مانیو 16 بیتی 22050Hz با فرمت .wav هستند.
ژانرها عبارتند از:
- بلوز
- کلاسیک
- کشور
- دیسکو
- هیپ هاپ
- جاز
- فلز
- ترکیدن
- رگی
سنگ
صفحه اصلی : http://marsyas.info/index.html
کد منبع :
tfds.audio.gtzan.GTZAN
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه بارگیری :
1.14 GiB
اندازه مجموعه داده :
3.71 GiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- ویژگی ها :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'audio/filename': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('audio', 'label')
نقل قول :
@misc{tzanetakis_essl_cook_2001,
author = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title = "Automatic Musical Genre Classification Of Audio Signals",
url = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year = "2001"
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):