voxceleb

  • Açıklama :

Konuşmacı tanımlaması için büyük ölçekli bir veri seti. Bu veriler, toplamda 150.000'den fazla örnekle 1.251'den fazla konuşmacıdan toplanmıştır. Bu sürüm, voxceleb1.1 veri kümesinin ses bölümünü içerir.

Bölmek Örnekler
'test' 7,972
'train' 134.000
'validation' 6.670
  • Özellikler :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=tf.string),
})
  • alıntı :
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}