Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

librispeech

 • opis:

LibriSpeech to zbiór ok. 1000 godzin czytanej mowy w języku angielskim z częstotliwością próbkowania 16 kHz, przygotowany przez Vassila Panayotova przy pomocy Daniela Poveya. Dane pochodzą z przeczytanych audiobooków z projektu LibriVox i zostały starannie posegmentowane i wyrównane.87

Podział Przykłady
'dev_clean' 2703
'dev_other' 2864
'test_clean' 2620
'test_other' 2939
'train_clean100' 28 539
'train_clean360' 104.014
'train_other500' 148 688
 • Cechy:
FeaturesDict({
  'chapter_id': tf.int64,
  'id': tf.string,
  'speaker_id': tf.int64,
  'speech': Audio(shape=(None,), dtype=tf.int64),
  'text': Text(shape=(), dtype=tf.string),
})
 • cytat:
@inproceedings{panayotov2015librispeech,
 title={Librispeech: an ASR corpus based on public domain audio books},
 author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
 booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
 pages={5206--5210},
 year={2015},
 organization={IEEE}
}