- توضیحات :
مجموعه داده GoEmotions حاوی 58k نظرات Reddit است که به دقت برای 27 دسته احساسات یا خنثی تنظیم شده است. دسته بندی احساسات عبارتند از تحسین ، سرگرمی ، عصبانیت ، دلخوری ، تأیید ، مراقبت ، گیجی ، کنجکاوی ، میل ، ناامیدی ، عدم تأیید ، انزجار ، خجالت ، هیجان ، ترس ، قدردانی ، اندوه ، شادی ، عشق ، عصبی بودن ، خوش بینی ، غرور ، تحقق ، تسکین ، پشیمانی ، غم ، تعجب.
صفحه اصلی : https://github.com/google-research/google-research/tree/master/goemotions
کد منبع :
tfds.text.Goemotions
نسخه ها :
-
0.1.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
4.19 MiB
اندازه مجموعه داده :
32.25 MiB
ذخیره خودکار ( مستندات ): بله
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 5427 |
'train' | 43،410 |
'validation' | 5426 |
- ویژگی ها :
FeaturesDict({
'admiration': tf.bool,
'amusement': tf.bool,
'anger': tf.bool,
'annoyance': tf.bool,
'approval': tf.bool,
'caring': tf.bool,
'comment_text': Text(shape=(), dtype=tf.string),
'confusion': tf.bool,
'curiosity': tf.bool,
'desire': tf.bool,
'disappointment': tf.bool,
'disapproval': tf.bool,
'disgust': tf.bool,
'embarrassment': tf.bool,
'excitement': tf.bool,
'fear': tf.bool,
'gratitude': tf.bool,
'grief': tf.bool,
'joy': tf.bool,
'love': tf.bool,
'nervousness': tf.bool,
'neutral': tf.bool,
'optimism': tf.bool,
'pride': tf.bool,
'realization': tf.bool,
'relief': tf.bool,
'remorse': tf.bool,
'sadness': tf.bool,
'surprise': tf.bool,
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):None
نقل قول :
@inproceedings{demszky-2020-goemotions,
title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
author = "Demszky, Dorottya and
Movshovitz-Attias, Dana and
Ko, Jeongwoo and
Cowen, Alan and
Nemade, Gaurav and
Ravi, Sujith",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.372",
pages = "4040--4054",
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):