O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

sentimento 140

  • Descrição:

Sentiment140 permite que você descubra o sentimento de uma marca, produto ou tópico no Twitter.

Os dados são um CSV com emoticons removidos. O formato do arquivo de dados possui 6 campos:

  1. a polaridade do tweet (0 = negativo, 2 = neutro, 4 = positivo)
  2. o id do tweet (2087)
  3. a data do tweet (sábado, 16 de maio, 23:58:44 UTC de 2009)
  4. a consulta (lyx). Se não houver consulta, este valor é NO_QUERY.
  5. o usuário que tweetou (robotickilldozr)
  6. o texto do tweet (Lyx é legal)

Para mais informações, consulte o documento Twitter Sentiment Classification com Supervisão distante à https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

Dividir Exemplos
'test' 498
'train' 1.600.000
  • Características:
FeaturesDict({
    'date': Text(shape=(), dtype=tf.string),
    'polarity': tf.int32,
    'query': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'user': Text(shape=(), dtype=tf.string),
})
  • citação:
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}