एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

वोक्ससेलेब

  • विवरण:

स्पीकर की पहचान के लिए बड़े पैमाने पर डेटासेट। यह डेटा 1,251 से अधिक वक्ताओं से एकत्र किया गया है, जिसमें कुल 150k से अधिक नमूने हैं। इस रिलीज़ में voxceleb1.1 डेटासेट का ऑडियो भाग शामिल है।

  • होमपेज: http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html

  • स्रोत कोड: tfds.audio.Voxceleb

  • संस्करण:

    • 1.2.1 (डिफ़ॉल्ट) : youtube_id फ़ील्ड जोड़ें
  • डाउनलोड का आकार: 4.68 MiB

  • डेटासेट का आकार: 107.98 GiB

  • मैनुअल डाउनलोड के निर्देश: यह डेटासेट आप में मैन्युअल रूप से स्रोत डेटा डाउनलोड करने के लिए की आवश्यकता है download_config.manual_dir (करने के लिए डिफ़ॉल्ट ~/tensorflow_datasets/downloads/manual/ ):
    मैन्युअल_दिर में फ़ाइल vox_dev_wav.zip होनी चाहिए। इस फाइल को डाउनलोड करने के निर्देश में पाए जाते हैं http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html यह डेटासेट पंजीकरण की आवश्यकता है।

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'test' 7,972
'train' १३४,०००
'validation' 6,670
  • विशेषताएं:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=tf.string),
})
  • प्रशस्ति पत्र:
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}