Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

voxceleb

  • Descripción:

Un conjunto de datos a gran escala para la identificación de hablantes. Estos datos se recopilan de más de 1.251 hablantes, con más de 150.000 muestras en total. Esta versión contiene la parte de audio del conjunto de datos voxceleb1.1.

  • Inicio: http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html

  • El código fuente: tfds.audio.Voxceleb

  • versiones:

    • 1.2.1 (por defecto) : Agregar campo youtube_id
  • Tamaño del paquete: 4.68 MiB

  • Tamaño de conjunto de datos: 107.98 GiB

  • Las instrucciones de descarga manual: Este conjunto de datos se requiere para descargar los datos de origen manualmente en download_config.manual_dir (por defecto ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir debe contener el archivo vox_dev_wav.zip. Las instrucciones para la descarga de este archivo se encuentran en http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html Este conjunto de datos requiere registro.

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'test' 7,972
'train' 134.000
'validation' 6.670
  • características:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=tf.string),
})
  • Cita:
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}