TFDS はCroissant 🥐 形式をサポートするようになりました。詳細については、ドキュメントをお読みください。

このページは Cloud Translation API によって翻訳されました。

gtzan_music_speech

説明:

データセットは、音楽/音声弁別の目的で収集されました。データセットは、それぞれ 30 秒の長さの 120 トラックで構成されています。各クラス (音楽/スピーチ) には 60 の例があります。トラックはすべて、.wav 形式の 22050Hz モノラル 16 ビットオーディオファイルです。

追加のドキュメント:コードを使用したペーパーの探索
ホームページ: http://marsyas.info/index.html
ソースコード: tfds.audio.gtzan_music_speech.GTZANMusicSpeech
バージョン:
- 1.0.0 (デフォルト): リリースノートはありません。
ダウンロードサイズ: 283.29 MiB
データセットサイズ: 424.64 MiB
自動キャッシュ(ドキュメント): いいえ
スプリット:

スプリット	例
`'train'`	128

機能構造:

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

機能のドキュメント:

特徴	クラス	形	Dtype	説明
	特徴辞書
オーディオ	オーディオ	（なし、）	int64
オーディオ/ファイル名	文章		ストリング
ラベル	クラスラベル		int64

監視されたキー( as_supervised docを参照): ('audio', 'label')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):

引用：

@ONLINE {Music Speech,
    author = "Tzanetakis, George",
    title  = "GTZAN Music/Speech Collection",
    year   = "1999",
    url    = "http://marsyas.info/index.html"
}

特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。

最終更新日 2023-01-04 UTC。