voxceleb

  • Descripción :

Un conjunto de datos a gran escala para la identificación de hablantes. Estos datos se recopilan de más de 1251 hablantes, con más de 150 000 muestras en total. Esta versión contiene la parte de audio del conjunto de datos voxceleb1.1.

Separar Ejemplos
'test' 7,972
'train' 134.000
'validation' 6,670
  • Estructura de características :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
audio Audio (Ninguna,) int64
etiqueta Etiqueta de clase int64
youtube_id Texto cuerda
  • Cita :
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}