امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

librispeech

  • توضیحات :

LibriSpeech مجموعه ای تقریباً 1000 ساعته از گفتار انگلیسی خوانده شده با سرعت نمونه گیری 16 کیلوهرتز است که توسط واسیل پانایوتوف با کمک دانیل پووی تهیه شده است. داده ها از کتاب های صوتی خوانده شده از پروژه LibriVox گرفته شده و با دقت تقسیم بندی و تراز بندی شده اند. 87

  • صفحه اصلی : http://www.openslr.org/12

  • کد منبع : tfds.audio.Librispeech

  • نسخه ها :

    • 2.1.0 (پیش فرض): بدون یادداشت انتشار.
  • اندازه بارگیری : 57.14 GiB

  • اندازه مجموعه داده : 304.47 GiB

  • ذخیره خودکار ( مستندات ): خیر

  • تقسیم :

شکاف مثال ها
'dev_clean' 2،703
'dev_other' 2،864
'test_clean' 2620
'test_other' 2،939
'train_clean100' 28،539
'train_clean360' 104،014
'train_other500' 148،688
  • ویژگی ها :
FeaturesDict({
    'chapter_id': tf.int64,
    'id': tf.string,
    'speaker_id': tf.int64,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('speech', 'text')

  • نقل قول :

@inproceedings{panayotov2015librispeech,
  title={Librispeech: an ASR corpus based on public domain audio books},
  author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
  booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
  pages={5206--5210},
  year={2015},
  organization={IEEE}
}