एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

ljspeech

  • विवरण:

यह एक सार्वजनिक डोमेन भाषण डेटासेट है जिसमें 7 गैर-काल्पनिक पुस्तकों के एकल स्पीकर पढ़ने के 13,100 लघु ऑडियो क्लिप शामिल हैं। प्रत्येक क्लिप के लिए एक ट्रांसक्रिप्शन प्रदान किया जाता है। क्लिप की लंबाई 1 से 10 सेकंड तक होती है और इनकी कुल लंबाई लगभग 24 घंटे होती है।

ग्रंथ 1884 और 1964 के बीच प्रकाशित हुए थे, और सार्वजनिक डोमेन में हैं। ऑडियो 2016-17 में LibriVox प्रोजेक्ट द्वारा रिकॉर्ड किया गया था और यह सार्वजनिक डोमेन में भी है।

  • होमपेज: https://keithito.com/LJ-Speech-Dataset/

  • स्रोत कोड: tfds.audio.Ljspeech

  • संस्करण:

    • 1.1.0 (डिफ़ॉल्ट): नहीं रिलीज नोट्स।
  • डाउनलोड का आकार: 2.56 GiB

  • डेटासेट का आकार: 10.73 GiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' १३,१००
  • विशेषताएं:
FeaturesDict({
    'id': tf.string,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
    'text_normalized': Text(shape=(), dtype=tf.string),
})
  • प्रशस्ति पत्र:
@misc{ljspeech17,
  author       = {Keith Ito},
  title        = {The LJ Speech Dataset},
  howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
  year         = 2017
}