Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

sentimen 140

  • Deskripsi :

Sentiment140 memungkinkan Anda untuk menemukan sentimen suatu merek, produk, atau topik di Twitter.

Datanya adalah CSV dengan emotikon dihapus. Format file data memiliki 6 bidang:

  1. polaritas tweet (0 = negatif, 2 = netral, 4 = positif)
  2. ID tweet (2087)
  3. tanggal tweet (Sabtu 16 Mei 23:58:44 UTC 2009)
  4. kueri (lyx). Jika tidak ada kueri, maka nilai ini adalah NO_QUERY.
  5. pengguna yang men-tweet (robotickilldozr)
  6. teks tweet (Lyx keren)

Untuk informasi lebih lanjut, lihat makalah Klasifikasi Sentimen Twitter dengan Pengawasan Jauh di https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

Membagi Contoh
'test' 498
'train' 1.600.000
  • Fitur :
FeaturesDict({
    'date': Text(shape=(), dtype=tf.string),
    'polarity': tf.int32,
    'query': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'user': Text(shape=(), dtype=tf.string),
})
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}