ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

voxforge

  • รายละเอียด:

VoxForge เป็นชุดข้อมูลการจำแนกภาษา ประกอบด้วยผู้ใช้ส่งคลิปเสียงที่ส่งไปยังเว็บไซต์ ในข่าวประชาสัมพันธ์ฉบับนี้ มีการเก็บรวบรวมข้อมูลจาก 6 ภาษา ได้แก่ อังกฤษ สเปน ฝรั่งเศส เยอรมัน รัสเซีย และอิตาลี เนื่องจากเว็บไซต์มีการปรับปรุงอย่างต่อเนื่อง และเพื่อประโยชน์ในการทำซ้ำ รุ่นนี้จึงมีเฉพาะบันทึกที่ส่งก่อนปี 2020-01-01 ตัวอย่างจะถูกแบ่งระหว่างรถไฟ การตรวจสอบ และการทดสอบ เพื่อให้ตัวอย่างจากผู้พูดแต่ละคนอยู่ในกลุ่มเดียวกัน

  • โฮมเพจ: http://www.voxforge.org/

  • รหัสที่มา: tfds.audio.Voxforge

  • รุ่น:

    • 1.0.0 (เริ่มต้น): ไม่มีบันทึกประจำรุ่น
  • ขนาดการดาวน์โหลด: Unknown size

  • ขนาดชุด: Unknown size

  • คำแนะนำการดาวน์โหลดคู่มือ: ชุดนี้คุณจะต้องดาวน์โหลดข้อมูลแหล่งที่มาของตนเองลงใน download_config.manual_dir (ค่าเริ่มต้น ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge ต้องการดาวน์โหลดไฟล์เสียงด้วยตนเอง รายการที่สมบูรณ์ของการเก็บสามารถพบได้ใน https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt ก็สามารถดาวน์โหลดได้โดยใช้คำสั่งต่อไปนี้: หมายเหตุ wget -i voxforge_urls.txt -x ที่ดาวน์โหลด และการสร้างชุดข้อมูลในเครื่องต้องใช้พื้นที่ดิสก์ประมาณ 100GB (แต่จะใช้เพียง ~60GB อย่างถาวร)

  • ออโต้แคช ( เอกสาร ): ไม่ทราบ

  • แยก:

สปลิต ตัวอย่าง
  • คุณสมบัติ:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): ('audio', 'label')

  • รูป ( tfds.show_examples ): ไม่ได้รับการสนับสนุน

  • ตัวอย่าง ( tfds.as_dataframe ): หายไป

  • อ้างอิง:

@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}