- توضیحات :
این یک مجموعه داده سخنرانی در حوزه عمومی است که شامل 13100 کلیپ صوتی کوتاه از یک سخنران منفرد است که قسمت هایی از 7 کتاب غیر داستانی را می خواند. برای هر کلیپ رونویسی در نظر گرفته شده است. طول کلیپ ها از 1 تا 10 ثانیه متفاوت است و طول کلی آنها تقریباً 24 ساعت است.
این متون بین سالهای 1884 و 1964 منتشر شده و در حوزه عمومی است. صدا در سال 17-2016 توسط پروژه LibriVox ضبط شده است و همچنین در مالکیت عمومی است.
صفحه اصلی : https://keithito.com/LJ-Speech-Dataset/
کد منبع :
tfds.audio.Ljspeech
نسخه ها :
-
1.1.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه بارگیری :
2.56 GiB
اندازه مجموعه داده :
10.73 GiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 13100 |
- ویژگی ها :
FeaturesDict({
'id': tf.string,
'speech': Audio(shape=(None,), dtype=tf.int64),
'text': Text(shape=(), dtype=tf.string),
'text_normalized': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('text_normalized', 'speech')
نقل قول :
@misc{ljspeech17,
author = {Keith Ito},
title = {The LJ Speech Dataset},
howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
year = 2017
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):