- Açıklama:
Sentiment140, Twitter'da bir markanın, ürünün veya konunun duyarlılığını keşfetmenize olanak tanır.
Veriler, ifadelerin kaldırıldığı bir CSV'dir. Veri dosyası formatının 6 alanı vardır:
- tweet'in polaritesi (0 = negatif, 2 = nötr, 4 = pozitif)
- tweetin kimliği (2087)
- tweet tarihi (16 Mayıs Cumartesi 23:58:44 UTC 2009)
- sorgu (lyx). Sorgu yoksa bu değer NO_QUERY'dir.
- tweet atan kullanıcı (robotickilldozr)
- tweet metni (Lyx harika)
Daha fazla bilgi için, en Uzak Denetim ile kağıt Heyecan Duygu Sınıflandırma bakın https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf
Anasayfa: http://help.sentiment140.com/home
Kaynak kodu:
tfds.text.sentiment140.Sentiment140
sürümleri:
-
1.0.0
(varsayılan): Hayır sürüm notları.
-
İndirme boyutu:
77.59 MiB
Veri kümesi boyutu:
305.13 MiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'test' | 498 |
'train' | 1.600.000 |
- Özellikler:
FeaturesDict({
'date': Text(shape=(), dtype=tf.string),
'polarity': tf.int32,
'query': Text(shape=(), dtype=tf.string),
'text': Text(shape=(), dtype=tf.string),
'user': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('text', 'polarity')
Şekil ( tfds.show_examples ): desteklenmez.
Örnekler ( tfds.as_dataframe ):
- Citation:
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}