لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

librispeech

  • الوصف :

LibriSpeech عبارة عن مجموعة من 1000 ساعة تقريبًا من قراءة الكلام باللغة الإنجليزية بمعدل أخذ عينات يبلغ 16 كيلو هرتز ، أعده فاسيل بانايوتوف بمساعدة دانيال بوفي. البيانات مستمدة من قراءة الكتب الصوتية من مشروع LibriVox ، وقد تم تقسيمها ومواءمتها بعناية.

  • الصفحة الرئيسية : http://www.openslr.org/12

  • كود المصدر : tfds.audio.Librispeech

  • إصدارات :

    • 2.1.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
  • حجم التحميل : 57.14 GiB

  • حجم مجموعة البيانات : 304.47 GiB

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • الانقسامات :

انشق، مزق أمثلة
'dev_clean' 2،703
'dev_other' 2864
'test_clean' 2،620
'test_other' 2939
'train_clean100' 28.539
'train_clean360' 104،014
'train_other500' 148688
  • الميزات :
FeaturesDict({
    'chapter_id': tf.int64,
    'id': tf.string,
    'speaker_id': tf.int64,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
})
  • الاقتباس :
@inproceedings{panayotov2015librispeech,
  title={Librispeech: an ASR corpus based on public domain audio books},
  author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
  booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
  pages={5206--5210},
  year={2015},
  organization={IEEE}
}