sentimento 140

  • Descrição :

O Sentiment140 permite que você descubra o sentimento de uma marca, produto ou tópico no Twitter.

Os dados são um CSV com emoticons removidos. O formato do arquivo de dados tem 6 campos:

  1. a polaridade do tweet (0 = negativo, 2 = neutro, 4 = positivo)
  2. o id do tweet (2087)
  3. a data do tweet (sábado, 16 de maio 23:58:44 UTC 2009)
  4. a consulta (lyx). Se não houver consulta, esse valor será NO_QUERY.
  5. o usuário que tuitou (robotickilldozr)
  6. o texto do tweet (Lyx é legal)

Para obter mais informações, consulte o artigo Twitter Sentiment Classification with Distant Supervision em https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

Dividir Exemplos
'test' 498
'train' 1.600.000
  • Estrutura de recursos :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Funcionalidade Aula Forma Tipo D Descrição
RecursosDict
encontro Texto fragmento
polaridade tensor int32
inquerir Texto fragmento
texto Texto fragmento
do utilizador Texto fragmento
  • Citação :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}