امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

کرم_د

  • توضیحات :

CREMA-D یک مجموعه داده های دیداری و شنیداری برای تشخیص احساسات است. مجموعه داده ها شامل عبارات احساسی صورت و صوتی در جملاتی است که در طیف وسیعی از حالات عاطفی اساسی (شاد ، غمگین ، عصبانیت ، ترس ، انزجار و خنثی) گفته می شود. 7،442 کلیپ از 91 بازیگر با پیشینه های مختلف قومی جمع آوری شد. این نسخه شامل فقط جریان صوتی از ضبط صدا و تصویر اصلی است. نمونه ها بین قطار ، اعتبار سنجی و آزمایش تقسیم می شوند به طوری که نمونه های هر بلندگو دقیقاً به یک تقسیم تعلق دارند.

شکاف مثال ها
'test' 1،556
'train' 5144
'validation' 738
  • ویژگی ها :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('audio', 'label')

  • نقل قول :

@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}