sentiment140

  • Description:

Sentiment140 vous permet de découvrir le sentiment d'une marque, d'un produit ou d'un sujet sur Twitter.

Les données sont au format CSV avec les émoticônes supprimées. Le format du fichier de données comporte 6 champs :

  1. la polarité du tweet (0 = négatif, 2 = neutre, 4 = positif)
  2. l'identifiant du tweet (2087)
  3. la date du tweet (samedi 16 mai 23:58:44 UTC 2009)
  4. la requête (lyx). S'il n'y a pas de requête, cette valeur est NO_QUERY.
  5. l'utilisateur qui a tweeté (robotickilldozr)
  6. le texte du tweet (Lyx est cool)

Pour plus d' informations, reportez - vous au document Twitter Classification avec surveillance Sentiment Distant à https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

Diviser Exemples
'test' 498
'train' 1 600 000
  • Caractéristiques:
FeaturesDict({
    'date': Text(shape=(), dtype=tf.string),
    'polarity': tf.int32,
    'query': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'user': Text(shape=(), dtype=tf.string),
})
  • citation:
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}