امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

لیبریت

  • توضیحات :

LibriTTS یک مجموعه انگلیسی چند سخنران است که تقریباً 585 ساعت سخنرانی انگلیسی را با سرعت نمونه گیری 24 کیلوهرتز خوانده است ، که توسط Heiga Zen و با کمک اعضای تیم Google Speech و Google Brain تهیه شده است. مجموعه LibriTTS برای تحقیقات TTS طراحی شده است. این از مواد اصلی (فایلهای صوتی mp3 از LibriVox و فایلهای متنی پروژه گوتنبرگ) از مجموعه LibriSpeech گرفته شده است. تفاوت های اصلی با مجموعه LibriSpeech در زیر ذکر شده است:

  1. فایل های صوتی با سرعت نمونه برداری 24 کیلوهرتز هستند.
  2. سخنرانی در شکستن جملات تقسیم می شود.
  3. هر دو متن اصلی و نرمال گنجانده شده است.
  4. اطلاعات متنی (به عنوان مثال ، جملات همسایه) را می توان استخراج کرد.
  5. اقوال با سر و صدای قابل توجه از مطالعه مستثنی هستند.
  • صفحه اصلی : http://www.openslr.org/60

  • کد منبع : tfds.audio.Libritts

  • نسخه ها :

    • 1.0.1 (پیش فرض): بدون یادداشت انتشار.
  • اندازه بارگیری : 78.42 GiB

  • اندازه مجموعه داده : 271.41 GiB

  • ذخیره خودکار ( مستندات ): خیر

  • تقسیم :

شکاف مثال ها
'dev_clean' 5،736
'dev_other' 4613
'test_clean' 4837
'test_other' 5،120
'train_clean100' 33،236
'train_clean360' 116.500
'train_other500' 205،044
  • ویژگی ها :
FeaturesDict({
    'chapter_id': tf.int64,
    'id': tf.string,
    'speaker_id': tf.int64,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text_normalized': Text(shape=(), dtype=tf.string),
    'text_original': Text(shape=(), dtype=tf.string),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('text_normalized', 'speech')

  • نقل قول :

@inproceedings{zen2019libritts,
  title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
  author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
  booktitle = {Proc. Interspeech},
  month = sep,
  year = {2019},
  doi = {10.21437/Interspeech.2019-2441},
}