لیبریت ها

توضیحات :

LibriTTS یک مجموعه انگلیسی چند سخنران است که تقریباً 585 ساعت گفتار انگلیسی خوانده شده با نرخ نمونه برداری 24 کیلوهرتز است که توسط Heiga Zen با کمک Google Speech و اعضای تیم Google Brain تهیه شده است. مجموعه LibriTTS برای تحقیقات TTS طراحی شده است. این از مواد اصلی (فایل های صوتی mp3 از LibriVox و فایل های متنی از پروژه گوتنبرگ) مجموعه LibriSpeech مشتق شده است. تفاوت های اصلی با مجموعه LibriSpeech در زیر ذکر شده است:

فایل های صوتی با نرخ نمونه برداری 24 کیلوهرتز هستند.
گفتار در شکستن جمله تقسیم می شود.
هر دو متن اصلی و عادی گنجانده شده است.
اطلاعات متنی (مثلاً جملات همسایه) قابل استخراج است.
جملات با نویز پس زمینه قابل توجه مستثنی هستند.

اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://www.openslr.org/60
کد منبع : tfds.datasets.libritts.Builder
نسخه ها :
- 1.0.1 (پیش فرض): بدون یادداشت انتشار.
حجم دانلود : 78.42 GiB
حجم مجموعه داده : 271.41 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'dev_clean'`	5736
`'dev_other'`	4613
`'test_clean'`	4,837
`'test_other'`	5,120
`'train_clean100'`	33,236
`'train_clean360'`	116500
`'train_other500'`	205,044

ساختار ویژگی :

FeaturesDict({
    'chapter_id': int64,
    'id': string,
    'speaker_id': int64,
    'speech': Audio(shape=(None,), dtype=int64),
    'text_normalized': Text(shape=(), dtype=string),
    'text_original': Text(shape=(), dtype=string),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
فصل_id	تانسور		int64
شناسه	تانسور		رشته
speaker_id	تانسور		int64
سخن، گفتار	سمعی	(هیچ یک،)	int64
text_normalized	متن		رشته
متن_اصل	متن		رشته

کلیدهای نظارت شده ( به عنوان_سند as_supervised مراجعه کنید): ('text_normalized', 'speech')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثال‌ها ( tfds.as_dataframe ):

نقل قول :

@inproceedings{zen2019libritts,
  title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
  author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
  booktitle = {Proc. Interspeech},
  month = sep,
  year = {2019},
  doi = {10.21437/Interspeech.2019-2441},
}

لیبریت ها با مجموعه‌ها، منظم بمانید ذخیره و طبقه‌بندی محتوا براساس اولویت‌های شما.

لیبریت ها