امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

ljspeech

 • توضیحات :

این یک مجموعه داده سخنرانی در حوزه عمومی است که شامل 13100 کلیپ صوتی کوتاه از یک سخنران منفرد است که قسمت هایی از 7 کتاب غیر داستانی را می خواند. برای هر کلیپ رونویسی در نظر گرفته شده است. طول کلیپ ها از 1 تا 10 ثانیه متفاوت است و طول کلی آنها تقریباً 24 ساعت است.

این متون بین سالهای 1884 و 1964 منتشر شده و در حوزه عمومی است. صدا در سال 17-2016 توسط پروژه LibriVox ضبط شده است و همچنین در مالکیت عمومی است.

شکاف مثال ها
'train' 13100
 • ویژگی ها :
FeaturesDict({
  'id': tf.string,
  'speech': Audio(shape=(None,), dtype=tf.int64),
  'text': Text(shape=(), dtype=tf.string),
  'text_normalized': Text(shape=(), dtype=tf.string),
})
 • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('text_normalized', 'speech')

 • نقل قول :

@misc{ljspeech17,
 author    = {Keith Ito},
 title    = {The LJ Speech Dataset},
 howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
 year     = 2017
}