感情140

  • 説明:

Sentiment140 を使用すると、Twitter でブランド、製品、またはトピックのセンチメントを発見できます。

データは、絵文字が削除された CSV です。データ ファイル形式には 6 つのフィールドがあります。

  1. ツイートの極性 (0 = ネガティブ、2 = ニュートラル、4 = ポジティブ)
  2. ツイートのID (2087)
  3. ツイートの日付 (Sat May 16 23:58:44 UTC 2009)
  4. クエリ (lyx)。クエリがない場合、この値は NO_QUERY です。
  5. ツイートしたユーザー (robotickilldozr)
  6. ツイートのテキスト (Lyx はクールです)

詳細については、 https: //cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf にある論文「遠隔監視による Twitter 感情分類」を参照してください。

スプリット
'test' 498
'train' 160万
  • 機能構造:
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
日にち文章ストリング
極性テンソルint32
クエリ文章ストリング
文章文章ストリング
ユーザー文章ストリング
  • 引用
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}