- Deskripsi :
Ini adalah kumpulan data ucapan domain publik yang terdiri dari 13.100 klip audio pendek dari satu bagian bacaan pembicara dari 7 buku non-fiksi. Transkripsi disediakan untuk setiap klip. Klip bervariasi panjangnya dari 1 hingga 10 detik dan memiliki total panjang sekitar 24 jam.
Teks-teks tersebut diterbitkan antara tahun 1884 dan 1964, dan berada dalam domain publik. Audio direkam pada 2016-17 oleh proyek LibriVox dan juga berada dalam domain publik.
Situs web : https://keithito.com/LJ-Speech-Dataset/
Kode sumber :
tfds.audio.Ljspeech
Versi :
-
1.1.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
2.56 GiB
Ukuran
10.73 GiB
data :10.73 GiB
Cache otomatis ( dokumentasi ): Tidak
Split :
Membagi | Contoh |
---|---|
'train' | 13.100 |
- Fitur :
FeaturesDict({
'id': tf.string,
'speech': Audio(shape=(None,), dtype=tf.int64),
'text': Text(shape=(), dtype=tf.string),
'text_normalized': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('text_normalized', 'speech')
Kutipan :
@misc{ljspeech17,
author = {Keith Ito},
title = {The LJ Speech Dataset},
howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
year = 2017
}
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):