Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

ljspeech.dll

  • Deskripsi :

Ini adalah kumpulan data ucapan domain publik yang terdiri dari 13.100 klip audio pendek dari satu bagian bacaan pembicara dari 7 buku non-fiksi. Transkripsi disediakan untuk setiap klip. Klip bervariasi panjangnya dari 1 hingga 10 detik dan memiliki total panjang sekitar 24 jam.

Teks-teks tersebut diterbitkan antara tahun 1884 dan 1964, dan berada dalam domain publik. Audio direkam pada 2016-17 oleh proyek LibriVox dan juga berada dalam domain publik.

Membagi Contoh
'train' 13.100
  • Fitur :
FeaturesDict({
    'id': tf.string,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
    'text_normalized': Text(shape=(), dtype=tf.string),
})
  • Kunci yang diawasi (Lihat as_supervised doc ): ('text_normalized', 'speech')

  • Kutipan :

@misc{ljspeech17,
  author       = {Keith Ito},
  title        = {The LJ Speech Dataset},
  howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
  year         = 2017
}