voxforge

توضیحات :

VoxForge یک مجموعه داده طبقه بندی زبان است. این شامل کلیپ های صوتی ارسال شده توسط کاربر است که به وب سایت ارسال می شود. در این نسخه، داده ها از 6 زبان - انگلیسی، اسپانیایی، فرانسوی، آلمانی، روسی و ایتالیایی جمع آوری شده است. از آنجایی که وب‌سایت دائماً به‌روزرسانی می‌شود و به‌منظور تکرارپذیری، این نسخه فقط شامل موارد ضبط شده است که قبل از 01-01-2020 ارسال شده است. نمونه ها بین قطار، اعتبارسنجی و آزمایش تقسیم می شوند به طوری که نمونه های هر بلندگو دقیقاً به یک تقسیم تعلق دارد.

اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://www.voxforge.org/
کد منبع : tfds.audio.Voxforge
نسخه ها :
- 1.0.0 (پیش فرض): بدون یادداشت انتشار.
اندازه دانلود : Unknown size
اندازه مجموعه داده : Unknown size
دستورالعمل‌های دانلود دستی : این مجموعه داده از شما می‌خواهد که داده‌های منبع را به صورت دستی در download_config.manual_dir (پیش‌فرض ~/tensorflow_datasets/downloads/manual/ ):
VoxForge به دانلود دستی آرشیوهای صوتی نیاز دارد. لیست کامل بایگانی ها را می توانید در https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt با استفاده از دستور زیر دانلود کنید: wget -i voxforge_urls.txt -x توجه داشته باشید که دانلود و ساخت مجموعه داده به صورت محلی به 100 گیگابایت فضای دیسک نیاز دارد (اما فقط 60 گیگابایت به طور دائم استفاده خواهد شد).
ذخیره خودکار ( اسناد ): ناشناخته
تقسیم ها :

شکاف	مثال ها

ساختار ویژگی :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
سمعی	سمعی	(هیچ یک،)	int64
برچسب	ClassLabel		int64
speaker_id	تانسور		رشته

کلیدهای نظارت شده (مشاهده as_supervised doc ): ('audio', 'label')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثال‌ها ( tfds.as_dataframe ): وجود ندارد.
نقل قول :

@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}