- תיאור:
מערך הנתונים של GoEmotions מכיל 58 אלף הערות שנערכו בקפידה של Reddit המסומנות עבור 27 קטגוריות רגשות או נייטרליות. קטגוריות הרגש הן הערצה, שעשוע, כעס, עצבנות, אישור, אכפתיות, בלבול, סקרנות, רצון, אכזבה, חוסר שביעות רצון, גועל נפש, מבוכה, התרגשות, פחד, הכרת תודה, אבל, שמחה, אהבה, עצבנות, אופטימיות, גאווה, מימוש, הקלה, חרטה, עצב, הפתעה.
דף הבית: https://github.com/google-research/google-research/tree/master/goemotions
קוד מקור:
tfds.text.Goemotions
גרסאות:
-
0.1.0
(ברירת המחדל): הערות השחרור לא.
-
גודל ההורדה:
4.19 MiB
מערך נתונים גודל:
32.25 MiB
Auto-במטמון ( תיעוד ): כן
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'test' | 5,427 |
'train' | 43,410 |
'validation' | 5,426 |
- מאפיינים:
FeaturesDict({
'admiration': tf.bool,
'amusement': tf.bool,
'anger': tf.bool,
'annoyance': tf.bool,
'approval': tf.bool,
'caring': tf.bool,
'comment_text': Text(shape=(), dtype=tf.string),
'confusion': tf.bool,
'curiosity': tf.bool,
'desire': tf.bool,
'disappointment': tf.bool,
'disapproval': tf.bool,
'disgust': tf.bool,
'embarrassment': tf.bool,
'excitement': tf.bool,
'fear': tf.bool,
'gratitude': tf.bool,
'grief': tf.bool,
'joy': tf.bool,
'love': tf.bool,
'nervousness': tf.bool,
'neutral': tf.bool,
'optimism': tf.bool,
'pride': tf.bool,
'realization': tf.bool,
'relief': tf.bool,
'remorse': tf.bool,
'sadness': tf.bool,
'surprise': tf.bool,
})
מפתחות השגחה (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט:
@inproceedings{demszky-2020-goemotions,
title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
author = "Demszky, Dorottya and
Movshovitz-Attias, Dana and
Ko, Jeongwoo and
Cowen, Alan and
Nemade, Gaurav and
Ravi, Sujith",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.372",
pages = "4040--4054",
}