امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

ljspeech

  • توضیحات :

این یک مجموعه داده سخنرانی در حوزه عمومی است که شامل 13100 کلیپ صوتی کوتاه از یک سخنران منفرد است که قسمت هایی از 7 کتاب غیر داستانی را می خواند. برای هر کلیپ رونویسی در نظر گرفته شده است. طول کلیپ ها از 1 تا 10 ثانیه متفاوت است و طول کلی آنها تقریباً 24 ساعت است.

این متون بین سالهای 1884 و 1964 منتشر شده و در حوزه عمومی است. صدا در سال 17-2016 توسط پروژه LibriVox ضبط شده است و همچنین در مالکیت عمومی است.

شکاف مثال ها
'train' 13100
  • ویژگی ها :
FeaturesDict({
    'id': tf.string,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
    'text_normalized': Text(shape=(), dtype=tf.string),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('text_normalized', 'speech')

  • نقل قول :

@misc{ljspeech17,
  author       = {Keith Ito},
  title        = {The LJ Speech Dataset},
  howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
  year         = 2017
}