امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

voxceleb

  • توضیحات :

یک مجموعه داده در مقیاس بزرگ برای شناسایی بلندگو. این داده ها با بیش از 150 هزار نمونه در کل از بیش از 1251 بلندگو جمع آوری شده است. این نسخه شامل قسمت صوتی مجموعه داده voxceleb1.1 است.

  • صفحه اصلی : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html

  • کد منبع : tfds.audio.Voxceleb

  • نسخه ها :

    • 1.1.1 (پیش فرض): بدون یادداشت انتشار.
  • اندازه بارگیری : 4.68 MiB

  • اندازه مجموعه داده : 107.97 GiB

  • دستورالعمل های بارگیری دستی : برای این مجموعه داده لازم است که داده های منبع را به صورت دستی در download_config.manual_dir (به طور پیش فرض ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir باید حاوی پرونده vox_dev_wav.zip باشد. دستورالعمل های بارگیری این پرونده در http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html یافت می شود این مجموعه داده نیاز به ثبت دارد.

  • ذخیره خودکار ( مستندات ): خیر

  • تقسیم :

شکاف مثال ها
'test' 7،972
'train' 134،000
'validation' 6،670
  • ویژگی ها :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1252),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('audio', 'label')

  • نقل قول :

@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}