- תיאור :
מערך הנתונים מורכב מ-1000 רצועות שמע כל 30 שניות באורך. הוא מכיל 10 ז'אנרים, כל אחד מיוצג על ידי 100 רצועות. כל הרצועות הן 22050Hz Mono 16-bit קבצי אודיו בפורמט .wav.
הז'אנרים הם:
- בלוז
- קלַאסִי
- מדינה
- דִיסקוֹ
- היפ הופ
- ג'ֶז
- מַתֶכֶת
- פּוֹפּ
- רגאיי
סלע
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : http://marsyas.info/index.html
קוד מקור :
tfds.audio.gtzan.GTZAN
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
1.14 GiB
גודל מערך נתונים :
3.71 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 1,000 |
- מבנה תכונה :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
שֶׁמַע | שֶׁמַע | (אף אחד,) | int64 | |
אודיו/שם קובץ | טֶקסט | חוּט | ||
תווית | ClassLabel | int64 |
מפתחות בפיקוח (ראה
as_supervised
doc ):('audio', 'label')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@misc{tzanetakis_essl_cook_2001,
author = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title = "Automatic Musical Genre Classification Of Audio Signals",
url = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year = "2001"
}