sentimento140

  • Descrizione :

Sentiment140 ti consente di scoprire il sentimento di un marchio, prodotto o argomento su Twitter.

I dati sono un CSV con le emoticon rimosse. Il formato del file di dati ha 6 campi:

  1. la polarità del tweet (0=negativo, 2=neutro, 4=positivo)
  2. l'id del tweet (2087)
  3. la data del tweet (Sat May 16 23:58:44 UTC 2009)
  4. la domanda (lyx). Se non è presente alcuna query, questo valore è NO_QUERY.
  5. l'utente che ha twittato (robotickilldozr)
  6. il testo del tweet (Lyx è figo)

Per ulteriori informazioni, fare riferimento al documento Twitter Sentiment Classification with Distant Supervision su https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

Diviso Esempi
'test' 498
'train' 1.600.000
  • Struttura delle caratteristiche :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
Data Testo corda
polarità Tensore int32
domanda Testo corda
testo Testo corda
utente Testo corda
  • Citazione :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}