- Açıklama :
Konuşmacı tanımlaması için büyük ölçekli bir veri seti. Bu veriler, toplamda 150.000'den fazla örnekle 1.251'den fazla konuşmacıdan toplanmıştır. Bu sürüm, voxceleb1.1 veri kümesinin ses bölümünü içerir.
Ana sayfa : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html
Kaynak kodu :
tfds.audio.Voxceleb
Sürümler :
-
1.2.1
(varsayılan): youtube_id alanı ekle
-
İndirme boyutu :
4.68 MiB
Veri kümesi boyutu :
107.98 GiB
Manuel indirme talimatları : Bu veri kümesi, kaynak verileri download_config.manual_dir içine manuel olarak
download_config.manual_dir
gerektirir (varsayılanı~/tensorflow_datasets/downloads/manual/
):
manual_dir, vox_dev_wav.zip dosyasını içermelidir. Bu dosyayı indirme talimatları http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html adresinde bulunur. Bu veri kümesi kayıt gerektirir.Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölmeler :
Bölmek | Örnekler |
---|---|
'test' | 7,972 |
'train' | 134.000 |
'validation' | 6.670 |
- Özellikler :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1252),
'youtube_id': Text(shape=(), dtype=tf.string),
})
Denetlenen anahtarlar (bkz
as_supervised
doc ):('audio', 'label')
Şekil ( tfds.show_examples ): Desteklenmez.
Örnekler ( tfds.as_dataframe ):
- alıntı :
@InProceedings{Nagrani17,
author = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
title = "VoxCeleb: a large-scale speaker identification dataset",
booktitle = "INTERSPEECH",
year = "2017",
}