voxforge

  • توضیحات :

VoxForge یک مجموعه داده طبقه بندی زبان است. این شامل کلیپ های صوتی ارسال شده توسط کاربر است که به وب سایت ارسال می شود. در این نسخه، داده ها از 6 زبان - انگلیسی، اسپانیایی، فرانسوی، آلمانی، روسی و ایتالیایی جمع آوری شده است. از آنجایی که وب‌سایت دائماً به‌روزرسانی می‌شود و به‌منظور تکرارپذیری، این نسخه فقط شامل موارد ضبط شده است که قبل از 01-01-2020 ارسال شده است. نمونه ها بین قطار، اعتبارسنجی و آزمایش تقسیم می شوند به طوری که نمونه های هر بلندگو دقیقاً به یک تقسیم تعلق دارد.

  • اسناد اضافی : کاوش در کاغذها با کد

  • صفحه اصلی : http://www.voxforge.org/

  • کد منبع : tfds.audio.Voxforge

  • نسخه ها :

    • 1.0.0 (پیش فرض): بدون یادداشت انتشار.
  • اندازه دانلود : Unknown size

  • اندازه مجموعه داده : Unknown size

  • دستورالعمل‌های دانلود دستی : این مجموعه داده از شما می‌خواهد که داده‌های منبع را به صورت دستی در download_config.manual_dir (پیش‌فرض ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge به دانلود دستی آرشیوهای صوتی نیاز دارد. لیست کامل بایگانی ها را می توانید در https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt با استفاده از دستور زیر دانلود کنید: wget -i voxforge_urls.txt -x توجه داشته باشید که دانلود و ساخت مجموعه داده به صورت محلی به 100 گیگابایت فضای دیسک نیاز دارد (اما فقط 60 گیگابایت به طور دائم استفاده خواهد شد).

  • ذخیره خودکار ( اسناد ): ناشناخته

  • تقسیم ها :

شکاف مثال ها
  • ساختار ویژگی :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
سمعی سمعی (هیچ یک،) int64
برچسب ClassLabel int64
speaker_id تانسور رشته
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}