voxforge

  • คำอธิบาย :

VoxForge เป็นชุดข้อมูลการจำแนกภาษา ประกอบด้วยคลิปเสียงที่ผู้ใช้ส่งมาที่เว็บไซต์ ในรุ่นนี้ มีการรวบรวมข้อมูลจาก 6 ภาษา ได้แก่ อังกฤษ สเปน ฝรั่งเศส เยอรมัน รัสเซีย และอิตาลี เนื่องจากเว็บไซต์มีการปรับปรุงอย่างต่อเนื่องและเพื่อความสามารถในการทำซ้ำ ข่าวประชาสัมพันธ์นี้จึงมีเฉพาะการบันทึกที่ส่งก่อนวันที่ 2020-01-01 เท่านั้น ตัวอย่างจะถูกแยกระหว่างการฝึก การตรวจสอบความถูกต้อง และการทดสอบ เพื่อให้ตัวอย่างจากลำโพงแต่ละตัวเป็นของการแยกส่วนเดียว

  • เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส

  • โฮมเพจ : http://www.voxforge.org/

  • รหัสแหล่งที่มา : tfds.audio.Voxforge

  • รุ่น :

    • 1.0.0 (ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
  • ขนาดการดาวน์โหลด : Unknown size

  • ขนาดชุดข้อมูล : Unknown size

  • คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน download_config.manual_dir (ค่าเริ่มต้นเป็น ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge ต้องการดาวน์โหลดไฟล์เสียงด้วยตนเอง รายการไฟล์เก็บถาวรทั้งหมดสามารถพบได้ใน https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt สามารถดาวน์โหลดได้โดยใช้คำสั่งต่อไปนี้: wget -i voxforge_urls.txt -x โปรดทราบว่าการดาวน์โหลด และการสร้างชุดข้อมูลในเครื่องต้องการพื้นที่ดิสก์ประมาณ 100GB (แต่จะใช้เพียง ~60GB อย่างถาวร)

  • แคชอัตโนมัติ ( เอกสาร ): ไม่รู้จัก

  • แยก :

แยก ตัวอย่าง
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
เสียง เครื่องเสียง (ไม่มี,) int64
ฉลาก ป้ายกำกับคลาส int64
รหัสลำโพง เทนเซอร์ สตริง
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): ('audio', 'label')

  • รูปภาพ ( tfds.show_examples ): ไม่รองรับ

  • ตัวอย่าง ( tfds.as_dataframe ): ไม่มี

  • การอ้างอิง :

@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}