ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

บรรณารักษ์

 • รายละเอียด:

LibriSpeech เป็นคลังข้อมูลของการอ่านคำพูดภาษาอังกฤษประมาณ 1,000 ชั่วโมง โดยมีอัตราการสุ่มตัวอย่าง 16 kHz ซึ่งจัดทำโดย Vassil Panayotov ด้วยความช่วยเหลือจาก Daniel Povey ข้อมูลได้มาจากการอ่านหนังสือเสียงจากโครงการ LibriVox และได้รับการแบ่งส่วนและจัดแนวอย่างระมัดระวัง87

 • โฮมเพจ: http://www.openslr.org/12

 • รหัสที่มา: tfds.audio.Librispeech

 • รุ่น:

  • 2.1.0 (เริ่มต้น): ไม่มีบันทึกประจำรุ่น
 • ขนาดการดาวน์โหลด: 57.14 GiB

 • ขนาดชุด: 304.47 GiB

 • ออโต้แคช ( เอกสาร ): ไม่มี

 • แยก:

แยก ตัวอย่าง
'dev_clean' 2,703
'dev_other' 2,864
'test_clean' 2,620
'test_other' 2,939
'train_clean100' 28,539
'train_clean360' 104,014
'train_other500' 148,688
 • คุณสมบัติ:
FeaturesDict({
  'chapter_id': tf.int64,
  'id': tf.string,
  'speaker_id': tf.int64,
  'speech': Audio(shape=(None,), dtype=tf.int64),
  'text': Text(shape=(), dtype=tf.string),
})
 • อ้างอิง:
@inproceedings{panayotov2015librispeech,
 title={Librispeech: an ASR corpus based on public domain audio books},
 author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
 booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
 pages={5206--5210},
 year={2015},
 organization={IEEE}
}