- Descripción:
El conjunto de datos de GoEmotions contiene 58k comentarios de Reddit cuidadosamente seleccionados y etiquetados para 27 categorías de emociones o Neutral. Las categorías de emoción son admiración, diversión, enfado, molestia, aprobación, afecto, confusión, curiosidad, deseo, decepción, desaprobación, disgusto, vergüenza, emoción, miedo, gratitud, pena, alegría, amor, nerviosismo, optimismo, orgullo, realización, alivio, remordimiento, tristeza, sorpresa.
Inicio: https://github.com/google-research/google-research/tree/master/goemotions
El código fuente:
tfds.text.Goemotions
versiones:
-
0.1.0
(por defecto): No hay notas de la versión.
-
Tamaño del paquete:
4.19 MiB
Conjunto de datos de tamaño:
32.25 MiB
Auto-caché ( documentación ): Sí
Fraccionamientos:
Separar | Ejemplos de |
---|---|
'test' | 5.427 |
'train' | 43.410 |
'validation' | 5.426 |
- características:
FeaturesDict({
'admiration': tf.bool,
'amusement': tf.bool,
'anger': tf.bool,
'annoyance': tf.bool,
'approval': tf.bool,
'caring': tf.bool,
'comment_text': Text(shape=(), dtype=tf.string),
'confusion': tf.bool,
'curiosity': tf.bool,
'desire': tf.bool,
'disappointment': tf.bool,
'disapproval': tf.bool,
'disgust': tf.bool,
'embarrassment': tf.bool,
'excitement': tf.bool,
'fear': tf.bool,
'gratitude': tf.bool,
'grief': tf.bool,
'joy': tf.bool,
'love': tf.bool,
'nervousness': tf.bool,
'neutral': tf.bool,
'optimism': tf.bool,
'pride': tf.bool,
'realization': tf.bool,
'relief': tf.bool,
'remorse': tf.bool,
'sadness': tf.bool,
'surprise': tf.bool,
})
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): No soportado.
Ejemplos ( tfds.as_dataframe ):
- Cita:
@inproceedings{demszky-2020-goemotions,
title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
author = "Demszky, Dorottya and
Movshovitz-Attias, Dana and
Ko, Jeongwoo and
Cowen, Alan and
Nemade, Gaurav and
Ravi, Sujith",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.372",
pages = "4040--4054",
}