ווקספורג'

  • תיאור :

VoxForge הוא מערך נתונים לסיווג שפות. הוא מורכב מקטעי אודיו שנשלחו על ידי המשתמשים שנשלחו לאתר. במהדורה זו נאספים נתונים מ-6 שפות - אנגלית, ספרדית, צרפתית, גרמנית, רוסית ואיטלקית. מאחר שהאתר מתעדכן כל הזמן, ולמען יכולת השחזור, מהדורה זו מכילה רק הקלטות שנשלחו לפני 2020-01-01. הדגימות מחולקות בין רכבת, אימות ובדיקה כך שדגימות מכל רמקול שייכות בדיוק לפיצול אחד.

  • תיעוד נוסף : חקור על ניירות עם קוד

  • דף הבית : http://www.voxforge.org/

  • קוד מקור : tfds.audio.Voxforge

  • גרסאות :

    • 1.0.0 (ברירת מחדל): אין הערות שחרור.
  • גודל הורדה : Unknown size

  • גודל ערכת נתונים : Unknown size

  • הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge דורש הורדה ידנית של ארכיוני האודיו. ניתן למצוא את רשימת הארכיונים המלאה ב- https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt ניתן להוריד אותו באמצעות הפקודה הבאה: wget -i voxforge_urls.txt -x שימו לב שהורדה ובניית מערך הנתונים באופן מקומי דורש שטח דיסק של ~100GB (אבל רק ~60GB ישמש לצמיתות).

  • שמור אוטומטי במטמון ( תיעוד ): לא ידוע

  • פיצולים :

לְפַצֵל דוגמאות
  • מבנה תכונה :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
שֶׁמַע שֶׁמַע (אף אחד,) int64
תווית ClassLabel int64
מזהה_רמקול מוֹתֵחַ חוּט
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}