voxforge

  • 説明

VoxForgeは言語分類データセットです。これは、Webサイトに送信されたユーザー送信のオーディオクリップで構成されています。このリリースでは、英語、スペイン語、フランス語、ドイツ語、ロシア語、イタリア語の6つの言語からのデータが収集されます。ウェブサイトは常に更新されており、再現性のために、このリリースには2020-01-01より前に提出された録音のみが含まれています。サンプルは、トレーニング、検証、テストの間で分割されるため、各スピーカーからのサンプルは正確に1つの分割に属します。

  • ホームページhttp://www.voxforge.org/

  • ソースコードtfds.audio.Voxforge

  • バージョン

    • 1.0.0 (デフォルト):リリースノート。
  • ダウンロードサイズUnknown size

  • データセットのサイズUnknown size

  • マニュアルダウンロード方法:このデータセットは、手動にソースデータをダウンロードする必要がありますdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ):
    VoxForgeでは、オーディオアーカイブを手動でダウンロードする必要があります。アーカイブの完全なリストはで見つけることができhttps://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txtのwget -i voxforge_urls.txt -xそのダウンロードに注意してください。それは、次のコマンドを使用してダウンロードすることができますデータセットをローカルで構築するには、最大100GBのディスク容量が必要です(ただし、永続的に使用されるのは最大60GBのみです)。

  • オートキャッシュされたドキュメント):不明

  • スプリット

スプリット
  • 特長
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}