gtzan_music_speech

الوصف :

تم جمع مجموعة البيانات لأغراض تمييز الموسيقى / الكلام. تتكون مجموعة البيانات من 120 مسارًا ، مدة كل منها 30 ثانية. يحتوي كل فصل (موسيقى / خطاب) على 60 مثالاً. المسارات هي جميع ملفات الصوت أحادية 16 بت 22050 هرتز بتنسيق .wav.

وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : http://marsyas.info/index.html
كود المصدر : tfds.audio.gtzan_music_speech.GTZANMusicSpeech
إصدارات :
- 1.0.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
حجم التحميل : 283.29 MiB
حجم مجموعة البيانات : 424.64 MiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :

انشق، مزق	أمثلة
`'train'`	128

هيكل الميزة :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

وثائق الميزة :

ميزة	فصل	شكل	نوع
	الميزات
صوتي	صوتي	(لا أحد،)	int64
الصوت / اسم الملف	نص		سلسلة
ضع الكلمة المناسبة	ClassLabel		int64

المفاتيح الخاضعة للإشراف (راجع المستند as_supervised ): ('audio', 'label')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):

الاقتباس :

@ONLINE {Music Speech,
    author = "Tzanetakis, George",
    title  = "GTZAN Music/Speech Collection",
    year   = "1999",
    url    = "http://marsyas.info/index.html"
}

gtzan_music_speech تنظيم صفحاتك في مجموعات يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.

gtzan_music_speech