感情140

  • 説明

Sentiment140を使用すると、Twitterでブランド、製品、またはトピックの感情を見つけることができます。

データは、絵文字が削除されたCSVです。データファイル形式には6つのフィールドがあります。

  1. ツイートの極性(0 =負、2 =中立、4 =正)
  2. ツイートのID(2087)
  3. ツイートの日付(2009年5月16日土曜日23:58:44 UTC)
  4. クエリ(lyx)。クエリがない場合、この値はNO_QUERYです。
  5. ツイートしたユーザー(robotickilldozr)
  6. ツイートのテキスト(Lyxはかっこいい)

詳細については、で遠くの監督と紙Twitterのセンチメントの分類を参照してくださいhttps://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

スプリット
'test' 498
'train' 1,600,000
  • 特長
FeaturesDict({
    'date': Text(shape=(), dtype=tf.string),
    'polarity': tf.int32,
    'query': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'user': Text(shape=(), dtype=tf.string),
})
  • 引用
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}