لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

خطاب

  • الوصف :

هذه مجموعة بيانات خطاب المجال العام تتكون من 13100 مقطع صوتي قصير لمتكلم واحد يقرأ مقاطع من 7 كتب غير روائية. يتم توفير نسخة لكل مقطع. يختلف طول المقاطع من 1 إلى 10 ثوانٍ ويبلغ إجمالي طولها حوالي 24 ساعة.

نُشرت النصوص بين عامي 1884 و 1964 ، وهي متاحة للعامة. تم تسجيل الصوت في 2016-2017 بواسطة مشروع LibriVox وهو أيضًا في المجال العام.

  • الصفحة الرئيسية https://keithito.com/LJ-Speech-Dataset/

  • كود المصدر : tfds.audio.Ljspeech

  • إصدارات :

    • 1.1.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
  • حجم التحميل : 2.56 GiB

  • حجم مجموعة البيانات : 10.73 GiB

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • الانقسامات :

انشق، مزق أمثلة
'train' 13100
  • الميزات :
FeaturesDict({
    'id': tf.string,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
    'text_normalized': Text(shape=(), dtype=tf.string),
})
  • الاقتباس :
@misc{ljspeech17,
  author       = {Keith Ito},
  title        = {The LJ Speech Dataset},
  howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
  year         = 2017
}