एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

भावना140

  • विवरण:

सेंटीमेंट१४० आपको ट्विटर पर किसी ब्रांड, उत्पाद या विषय की भावना को खोजने की अनुमति देता है।

डेटा एक CSV है जिसमें इमोटिकॉन हटा दिए गए हैं। डेटा फ़ाइल स्वरूप में 6 फ़ील्ड हैं:

  1. ट्वीट की ध्रुवता (0 = नकारात्मक, 2 = तटस्थ, 4 = सकारात्मक)
  2. ट्वीट की आईडी (2087)
  3. ट्वीट की तारीख (शनि 16 मई 23:58:44 यूटीसी 2009)
  4. क्वेरी (lyx)। यदि कोई क्वेरी नहीं है, तो यह मान NO_QUERY है।
  5. वह उपयोगकर्ता जिसने ट्वीट किया (robotickilldozr)
  6. ट्वीट का पाठ (Lyx अच्छा है)

अधिक जानकारी के लिए, पर दूर पर्यवेक्षण के साथ कागज ट्विटर भावना वर्गीकरण का उल्लेख https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

विभाजित करना उदाहरण
'test' 498
'train' 1,600,000
  • विशेषताएं:
FeaturesDict({
    'date': Text(shape=(), dtype=tf.string),
    'polarity': tf.int32,
    'query': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'user': Text(shape=(), dtype=tf.string),
})
  • प्रशस्ति पत्र:
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}