רגשות

  • תיאור:

מערך הנתונים של GoEmotions מכיל 58 אלף הערות שנערכו בקפידה של Reddit המסומנות עבור 27 קטגוריות רגשות או נייטרליות. קטגוריות הרגש הן הערצה, שעשוע, כעס, עצבנות, אישור, אכפתיות, בלבול, סקרנות, רצון, אכזבה, חוסר שביעות רצון, גועל נפש, מבוכה, התרגשות, פחד, הכרת תודה, אבל, שמחה, אהבה, עצבנות, אופטימיות, גאווה, מימוש, הקלה, חרטה, עצב, הפתעה.

לְפַצֵל דוגמאות
'test' 5,427
'train' 43,410
'validation' 5,426
  • מאפיינים:
FeaturesDict({
    'admiration': tf.bool,
    'amusement': tf.bool,
    'anger': tf.bool,
    'annoyance': tf.bool,
    'approval': tf.bool,
    'caring': tf.bool,
    'comment_text': Text(shape=(), dtype=tf.string),
    'confusion': tf.bool,
    'curiosity': tf.bool,
    'desire': tf.bool,
    'disappointment': tf.bool,
    'disapproval': tf.bool,
    'disgust': tf.bool,
    'embarrassment': tf.bool,
    'excitement': tf.bool,
    'fear': tf.bool,
    'gratitude': tf.bool,
    'grief': tf.bool,
    'joy': tf.bool,
    'love': tf.bool,
    'nervousness': tf.bool,
    'neutral': tf.bool,
    'optimism': tf.bool,
    'pride': tf.bool,
    'realization': tf.bool,
    'relief': tf.bool,
    'remorse': tf.bool,
    'sadness': tf.bool,
    'surprise': tf.bool,
})
  • ציטוט:
@inproceedings{demszky-2020-goemotions,
    title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
    author = "Demszky, Dorottya  and
      Movshovitz-Attias, Dana  and
      Ko, Jeongwoo  and
      Cowen, Alan  and
      Nemade, Gaurav  and
      Ravi, Sujith",
    booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
    month = jul,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.acl-main.372",
    pages = "4040--4054",
}