- توضیحات :
VoxForge یک مجموعه داده طبقه بندی زبان است. این شامل کلیپ های صوتی ارسال شده توسط کاربر ارسال شده به وب سایت است. در این نسخه ، داده ها از 6 زبان - انگلیسی ، اسپانیایی ، فرانسوی ، آلمانی ، روسی و ایتالیایی جمع آوری شده است. از آنجا که وب سایت به طور مداوم به روز می شود ، و به منظور تکرارپذیری ، این نسخه فقط شامل ضبط های ارسال شده قبل از 2020-01-01 است. نمونه ها بین قطار ، اعتبار سنجی و آزمایش تقسیم می شوند به طوری که نمونه های هر بلندگو دقیقاً به یک تقسیم تعلق دارند.
صفحه اصلی : http://www.voxforge.org/
کد منبع :
tfds.audio.Voxforge
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه بارگیری :
Unknown size
اندازه مجموعه داده :
Unknown size
دستورالعمل های بارگیری دستی : برای این مجموعه داده لازم است که داده های منبع را به صورت دستی در
download_config.manual_dir
(به طور پیش فرض~/tensorflow_datasets/downloads/manual/
):
VoxForge نیاز به بارگیری بایگانی های صوتی دستی دارد. لیست کامل بایگانی ها را می توان در https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt یافت. با استفاده از دستور زیر بارگیری می شود: wget -i voxforge_urls.txt -x توجه داشته باشید که بارگیری و ساخت مجموعه داده به صورت محلی به 100 گیگابایت فضای دیسک نیاز دارد (اما فقط 60 گیگابایت به صورت دائمی استفاده می شود).ذخیره خودکار ( مستندات ): ناشناخته است
تقسیم :
شکاف | مثال ها |
---|
- ویژگی ها :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'speaker_id': tf.string,
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('audio', 'label')
نقل قول :
@article{maclean2018voxforge,
title={Voxforge},
author={MacLean, Ken},
journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
year={2018}
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ): موجود نیست.