sentiments140

  • Descriptif :

Sentiment140 vous permet de découvrir le sentiment d'une marque, d'un produit ou d'un sujet sur Twitter.

Les données sont un CSV avec les émoticônes supprimées. Le format du fichier de données comporte 6 champs :

  1. la polarité du tweet (0 = négatif, 2 = neutre, 4 = positif)
  2. l'identifiant du tweet (2087)
  3. la date du tweet (samedi 16 mai 23:58:44 UTC 2009)
  4. la requête (lyx). S'il n'y a pas de requête, cette valeur est NO_QUERY.
  5. l'utilisateur qui a tweeté (robotickilldozr)
  6. le texte du tweet (Lyx c'est cool)

Pour plus d'informations, reportez-vous à l'article Twitter Sentiment Classification with Distant Supervision à l' adresse https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

Diviser Exemples
'test' 498
'train' 1 600 000
  • Structure des fonctionnalités :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classe Façonner Dtype Description
FonctionnalitésDict
Date Texte chaîne de caractères
polarité Tenseur int32
requete Texte chaîne de caractères
texte Texte chaîne de caractères
utilisateur Texte chaîne de caractères
  • Citation :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}