• 説明

Groove MIDIデータセット(GMD)は、Roland TD-11 V-Drum電子ドラムキットでキャプチャされた、13.6時間のアラインされたMIDIと、人間が実行するテンポアラインされた表現力豊かなドラムの(合成された)オーディオで構成されます。

@inproceedings{groove2019,
    Author = {Jon Gillick and Adam Roberts and Jesse Engel and Douglas Eck and David Bamman},
    Title = {Learning to Groove with Inverse Sequence Transformations},
    Booktitle   = {International Conference on Machine Learning (ICML)}
    Year = {2019},
}

グルーブ/フルミディオン(デフォルト設定)

  • コンフィグの説明:音声なしのグルーヴデータセット、分割されていません。

  • ダウンロードサイズ3.11 MiB

  • データセットサイズ5.22 MiB

  • オートキャッシュされたドキュメント):はい

  • スプリット

スプリット
'test' 129
'train' 897
'validation' 124
  • 特長
FeaturesDict({
    'bpm': tf.int32,
    'drummer': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'id': tf.string,
    'midi': tf.string,
    'style': FeaturesDict({
        'primary': ClassLabel(shape=(), dtype=tf.int64, num_classes=18),
        'secondary': tf.string,
    }),
    'time_signature': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

グルーブ/フル-16000hz

  • コンフィグの説明:オーディオ、分割されていないとGrooveのデータセット。

  • ダウンロードサイズ4.76 GiB

  • データセットサイズ2.33 GiB

  • オートキャッシュされたドキュメント):いいえ

  • スプリット

スプリット
'test' 124
'train' 846
'validation' 120
  • 特長
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.float32),
    'bpm': tf.int32,
    'drummer': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'id': tf.string,
    'midi': tf.string,
    'style': FeaturesDict({
        'primary': ClassLabel(shape=(), dtype=tf.int64, num_classes=18),
        'secondary': tf.string,
    }),
    'time_signature': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

溝/ 2bar-midionly

  • コンフィグの説明:音声なしGrooveのデータセット、2小節のチャンクに分割。

  • ダウンロードサイズ3.11 MiB

  • データセットサイズ19.59 MiB

  • オートキャッシュされたドキュメント):はい

  • スプリット

スプリット
'test' 2,204
'train' 18,163
'validation' 2,252
  • 特長
FeaturesDict({
    'bpm': tf.int32,
    'drummer': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'id': tf.string,
    'midi': tf.string,
    'style': FeaturesDict({
        'primary': ClassLabel(shape=(), dtype=tf.int64, num_classes=18),
        'secondary': tf.string,
    }),
    'time_signature': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

溝/ 2bar-16000hz

  • コンフィグの説明:オーディオとGrooveのデータセット、2小節のチャンクに分割。

  • ダウンロードサイズ4.76 GiB

  • データセットサイズ4.61 GiB

  • オートキャッシュされたドキュメント):いいえ

  • スプリット

スプリット
'test' 1,873
'train' 14,390
'validation' 2,034
  • 特長
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.float32),
    'bpm': tf.int32,
    'drummer': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'id': tf.string,
    'midi': tf.string,
    'style': FeaturesDict({
        'primary': ClassLabel(shape=(), dtype=tf.int64, num_classes=18),
        'secondary': tf.string,
    }),
    'time_signature': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

溝/ 4bar-midionly

  • コンフィグの説明:音声なしのグルーヴデータセット、4小節のチャンクに分割。

  • ダウンロードサイズ3.11 MiB

  • データセットサイズ27.32 MiB

  • オートキャッシュされたドキュメント):はい

  • スプリット

スプリット
'test' 2,033
'train' 17,261
'validation' 2,121
  • 特長
FeaturesDict({
    'bpm': tf.int32,
    'drummer': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'id': tf.string,
    'midi': tf.string,
    'style': FeaturesDict({
        'primary': ClassLabel(shape=(), dtype=tf.int64, num_classes=18),
        'secondary': tf.string,
    }),
    'time_signature': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})