- توضیحات :
شصت ضبط از یک فرد به عبری بله یا نه گفتن ؛ هر ضبط هشت کلمه است.
نکته اصلی مجموعه داده ارائه روشی آسان و سریع برای تست رایگان اسکریپت های Kaldi است.
بایگانی "waves_yesno.tar.gz" شامل 60 پرونده .wav است که نمونه برداری آن 8 کیلوهرتز است. همه توسط یک گوینده مرد و به عبری ضبط شده است. در هر پرونده ، فرد 8 کلمه می گوید. هر کلمه یا به زبان عبری برای "بله" یا "نه" است ، بنابراین هر پرونده یک توالی تصادفی از 8 بله یا نه دارد. رونویسی جداگانه ارائه نشده است. توالی در نام پرونده کدگذاری می شود ، با 1 برای بله و 0 برای خیر.
صفحه اصلی : https://www.openslr.org/1/
کد منبع :
tfds.audio.yesno.YesNo
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه بارگیری :
4.49 MiB
اندازه مجموعه داده :
16.27 MiB
ذخیره خودکار ( مستندات ): بله
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 60 |
- ویژگی ها :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'audio/filename': Text(shape=(), dtype=tf.string),
'label': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=2)),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('audio', 'label')
نقل قول :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):