एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

वोक्सफोर्ज

  • विवरण:

VoxForge एक भाषा वर्गीकरण डेटासेट है। इसमें वेबसाइट पर सबमिट किए गए उपयोगकर्ता द्वारा प्रस्तुत ऑडियो क्लिप शामिल हैं। इस रिलीज में, 6 भाषाओं से डेटा एकत्र किया जाता है - अंग्रेजी, स्पेनिश, फ्रेंच, जर्मन, रूसी और इतालवी। चूंकि वेबसाइट को लगातार अपडेट किया जाता है, और पुनरुत्पादन के लिए, इस रिलीज़ में केवल 2020-01-01 से पहले सबमिट की गई रिकॉर्डिंग शामिल हैं। नमूनों को ट्रेन, सत्यापन और परीक्षण के बीच विभाजित किया जाता है ताकि प्रत्येक स्पीकर के नमूने ठीक एक विभाजन के हों।

  • होमपेज: http://www.voxforge.org/

  • स्रोत कोड: tfds.audio.Voxforge

  • संस्करण:

    • 1.0.0 (डिफ़ॉल्ट): नहीं रिलीज नोट्स।
  • डाउनलोड का आकार: Unknown size

  • डेटासेट का आकार: Unknown size

  • मैनुअल डाउनलोड के निर्देश: यह डेटासेट आप में मैन्युअल रूप से स्रोत डेटा डाउनलोड करने के लिए की आवश्यकता है download_config.manual_dir (करने के लिए डिफ़ॉल्ट ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge को ऑडियो अभिलेखागार के मैनुअल डाउनलोड की आवश्यकता है। अभिलेखागार की पूरी सूची में पाया जा सकता https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt यह निम्न आदेश का उपयोग कर डाउनलोड किया जा सकता: wget मैं voxforge_urls.txt -x ध्यान दें कि डाउनलोड और स्थानीय रूप से डेटासेट बनाने के लिए ~100GB डिस्क स्थान की आवश्यकता होती है (लेकिन केवल ~60GB स्थायी रूप से उपयोग किया जाएगा)।

  • ऑटो-कैश ( प्रलेखन ): अज्ञात

  • विभाजन:

विभाजित करें उदाहरण
  • विशेषताएं:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
  • पर्यवेक्षित कुंजियों (देखें as_supervised डॉक ): ('audio', 'label')

  • चित्रा ( tfds.show_examples ): समर्थित नहीं।

  • उदाहरण ( tfds.as_dataframe ): लापता।

  • प्रशस्ति पत्र:

@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}