voxforge

  • תיאור:

VoxForge הוא מערך סיווג שפה. הוא מורכב מקטעי שמע שהוגשו על ידי המשתמשים שהוגשו לאתר. במהדורה זו נאספים נתונים משש שפות - אנגלית, ספרדית, צרפתית, גרמנית, רוסית ואיטלקית. מכיוון שהאתר מתעדכן כל הזמן, ולמען הפיכות לשחזור, מהדורה זו מכילה רק הקלטות שהוגשו לפני 2020-01-01. הדוגמאות מפוצלות בין רכבת, אימות ובדיקה כך שדגימות מכל רמקול שייכות לפיצול אחד בדיוק.

  • דף הבית: http://www.voxforge.org/

  • קוד מקור: tfds.audio.Voxforge

  • גרסאות:

    • 1.0.0 (ברירת המחדל): הערות השחרור לא.
  • גודל ההורדה: Unknown size

  • גודל בסיס הנתונים: Unknown size

  • הוראות הורדה ידנית: מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני לתוך download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge דורש הורדה ידנית של ארכיוני האודיו. רשימה מלאה של הארכיונים ניתן למצוא https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt זה ניתן להוריד באמצעות הפקודה הבאה: wget -i voxforge_urls.txt -X הערה כי הורדת ובניית מערך הנתונים באופן מקומי דורשת שטח דיסק בנפח של 100 ג'יגה-בייט (אך רק ~ 60 ג'יגה-בתים ישמש לצמיתות).

  • Auto-במטמון ( תיעוד ): לא ידוע

  • פיצולים:

לְפַצֵל דוגמאות
  • מאפיינים:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}