ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

vctk

 • รายละเอียด:

CSTR VCTK Corpus นี้มีข้อมูลคำพูดที่เปล่งออกมาโดยผู้พูดภาษาอังกฤษ 110 คนพร้อมสำเนียงต่างๆ ผู้พูดแต่ละคนอ่านประโยคประมาณ 400 ประโยค ซึ่งได้รับการคัดเลือกจากหนังสือพิมพ์ ข้อความสีรุ้ง และย่อหน้าที่ใช้สำหรับเก็บเสียงพูด

โปรดทราบว่าข้อความ 'p315' หายไปเนื่องจากข้อผิดพลาดของฮาร์ดดิสก์

 • โฮมเพจ: https://doi.org/10.7488/ds/2645

 • รหัสที่มา: tfds.audio.Vctk

 • รุ่น:

  • 1.0.0 (เริ่มต้น): ปล่อย VCTK 0.92.0
 • ขนาดการดาวน์โหลด: 10.94 GiB

 • ออโต้แคช ( เอกสาร ): ไม่มี

 • คุณสมบัติ:

FeaturesDict({
  'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=13),
  'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
  'id': tf.string,
  'speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=110),
  'speech': Audio(shape=(None,), dtype=tf.int64),
  'text': Text(shape=(), dtype=tf.string),
})
 • คีย์ภายใต้การดูแล (ดู as_supervised doc ): ('text', 'speech')

 • รูป ( tfds.show_examples ): ไม่ได้รับการสนับสนุน

 • อ้างอิง:

@misc{yamagishi2019vctk,
 author={Yamagishi, Junichi and Veaux, Christophe and MacDonald, Kirsten},
 title={ {CSTR VCTK Corpus}: English Multi-speaker Corpus for {CSTR} Voice Cloning Toolkit (version 0.92)},
 publisher={University of Edinburgh. The Centre for Speech Technology Research (CSTR)},
 year=2019,
 doi={10.7488/ds/2645},
}

vctk/mic1 (การกำหนดค่าเริ่มต้น)

 • คำอธิบาย Config: เสียงที่บันทึกไว้ใช้ไมโครโฟนรอบทิศทาง (DPA 4035) ประกอบด้วยสัญญาณรบกวนความถี่ต่ำมาก

     This is the same audio released in previous versions of VCTK:
     https://doi.org/10.7488/ds/1994
  
 • ขนาดชุด: 39.87 GiB

 • แยก:

แยก ตัวอย่าง
'train' 44,455

vctk/mic2

 • คำอธิบาย Config: เสียงบันทึกโดยใช้ไมโครโฟนคอนเดนเซอร์ไดอะแฟรมขนาดเล็กที่มีแบนด์วิดธ์ที่กว้างมาก (Sennheiser MKH 800)

     Two speakers, p280 and p315 had technical issues of the audio
     recordings using MKH 800.
  
 • ขนาดชุด: 38.86 GiB

 • แยก:

แยก ตัวอย่าง
'train' 43,873