sentyment140

  • opis :

Sentiment140 pozwala odkryć sentyment marki, produktu lub tematu na Twitterze.

Dane to plik CSV z usuniętymi emotikonami. Format pliku danych ma 6 pól:

  1. polaryzacja tweeta (0 = negatywna, 2 = neutralna, 4 = pozytywna)
  2. identyfikator tweeta (2087)
  3. data tweeta (sobota 16 maja 23:58:44 UTC 2009)
  4. zapytanie (lyx). Jeśli nie ma zapytania, ta wartość to NO_QUERY.
  5. użytkownik, który tweetował (robotickilldozr)
  6. tekst tweeta (Lyx jest fajny)

Aby uzyskać więcej informacji, zapoznaj się z artykułem Twitter Sentiment Classification with Distant Supervision pod adresem https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

Podział Przykłady
'test' 498
'train' 1 600 000
  • Struktura funkcji :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
data Tekst strunowy
biegunowość Napinacz int32
zapytanie Tekst strunowy
tekst Tekst strunowy
użytkownik Tekst strunowy
  • Cytat :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}