أخدود

  • الوصف :

تتكون مجموعة بيانات Groove MIDI (GMD) من 13.6 ساعة من MIDI المحاذاة والصوت (المركب) لقرع الطبول التعبيري الذي يؤديه الإنسان والمحاذاة للإيقاع والذي تم التقاطه على مجموعة الأسطوانة الإلكترونية Roland TD-11 V-Drum.

@inproceedings{groove2019,
    Author = {Jon Gillick and Adam Roberts and Jesse Engel and Douglas Eck and David Bamman},
    Title = {Learning to Groove with Inverse Sequence Transformations},
    Booktitle   = {International Conference on Machine Learning (ICML)}
    Year = {2019},
}

groove / full-midionly (التكوين الافتراضي)

  • وصف التكوين : مجموعة بيانات Groove بدون صوت ، غير مقسم.

  • حجم التحميل : 3.11 MiB

  • حجم مجموعة البيانات : 5.22 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الانقسامات :

انشق، مزق أمثلة
'test' 129
'train' 897
'validation' 124
  • هيكل الميزة :
FeaturesDict({
    'bpm': int32,
    'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'id': string,
    'midi': string,
    'style': FeaturesDict({
        'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
        'secondary': string,
    }),
    'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
نبضة في الدقيقة موتر int32
الطبال ClassLabel int64
هوية شخصية موتر سلسلة
ميدي موتر سلسلة
نمط الميزات
النمط / الأساسي ClassLabel int64
اسلوب / ثانوي موتر سلسلة
وقت التوقيع ClassLabel int64
يكتب ClassLabel int64

أخدود / كامل 16000 هرتز

  • وصف التكوين : مجموعة بيانات Groove مع الصوت وغير المنقسمة.

  • حجم التحميل : 4.76 GiB

  • حجم مجموعة البيانات : 2.33 GiB

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • الانقسامات :

انشق، مزق أمثلة
'test' 124
'train' 846
'validation' 120
  • هيكل الميزة :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=float32),
    'bpm': int32,
    'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'id': string,
    'midi': string,
    'style': FeaturesDict({
        'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
        'secondary': string,
    }),
    'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صوتي صوتي (لا أحد،) تعويم 32
نبضة في الدقيقة موتر int32
الطبال ClassLabel int64
هوية شخصية موتر سلسلة
ميدي موتر سلسلة
نمط الميزات
النمط / الأساسي ClassLabel int64
اسلوب / ثانوي موتر سلسلة
وقت التوقيع ClassLabel int64
يكتب ClassLabel int64

أخدود / 2 بار - منتصف

  • وصف التكوين : مجموعة بيانات Groove بدون صوت ، مقسمة إلى قطع 2 بار.

  • حجم التحميل : 3.11 MiB

  • حجم مجموعة البيانات : 19.59 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الانقسامات :

انشق، مزق أمثلة
'test' 2،204
'train' 18163
'validation' 2،252
  • هيكل الميزة :
FeaturesDict({
    'bpm': int32,
    'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'id': string,
    'midi': string,
    'style': FeaturesDict({
        'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
        'secondary': string,
    }),
    'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
نبضة في الدقيقة موتر int32
الطبال ClassLabel int64
هوية شخصية موتر سلسلة
ميدي موتر سلسلة
نمط الميزات
النمط / الأساسي ClassLabel int64
اسلوب / ثانوي موتر سلسلة
وقت التوقيع ClassLabel int64
يكتب ClassLabel int64

أخدود / 2 بار -16000 هرتز

  • وصف التكوين : مجموعة بيانات Groove مع الصوت ، مقسمة إلى قطع 2 بار.

  • حجم التحميل : 4.76 GiB

  • حجم مجموعة البيانات : 4.61 GiB

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • الانقسامات :

انشق، مزق أمثلة
'test' 1873
'train' 14.390
'validation' 2،034
  • هيكل الميزة :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=float32),
    'bpm': int32,
    'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'id': string,
    'midi': string,
    'style': FeaturesDict({
        'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
        'secondary': string,
    }),
    'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صوتي صوتي (لا أحد،) تعويم 32
نبضة في الدقيقة موتر int32
الطبال ClassLabel int64
هوية شخصية موتر سلسلة
ميدي موتر سلسلة
نمط الميزات
النمط / الأساسي ClassLabel int64
اسلوب / ثانوي موتر سلسلة
وقت التوقيع ClassLabel int64
يكتب ClassLabel int64

الأخدود / 4 بار-منتصف الليل

  • وصف التكوين : مجموعة بيانات Groove بدون صوت ، مقسمة إلى قطع 4 بار.

  • حجم التحميل : 3.11 MiB

  • حجم مجموعة البيانات : 27.32 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الانقسامات :

انشق، مزق أمثلة
'test' 2،033
'train' 17261
'validation' 2،121
  • هيكل الميزة :
FeaturesDict({
    'bpm': int32,
    'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'id': string,
    'midi': string,
    'style': FeaturesDict({
        'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
        'secondary': string,
    }),
    'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
نبضة في الدقيقة موتر int32
الطبال ClassLabel int64
هوية شخصية موتر سلسلة
ميدي موتر سلسلة
نمط الميزات
النمط / الأساسي ClassLabel int64
اسلوب / ثانوي موتر سلسلة
وقت التوقيع ClassLabel int64
يكتب ClassLabel int64