অনুভূতি140

  • বর্ণনা :

Sentiment140 আপনাকে টুইটারে একটি ব্র্যান্ড, পণ্য বা বিষয়ের অনুভূতি আবিষ্কার করতে দেয়।

ডেটা হল একটি CSV যার ইমোটিকনগুলি সরানো হয়েছে৷ ডেটা ফাইল ফর্ম্যাটে 6 টি ক্ষেত্র রয়েছে:

  1. টুইটের পোলারিটি (0 = নেতিবাচক, 2 = নিরপেক্ষ, 4 = ইতিবাচক)
  2. টুইটের আইডি (2087)
  3. টুইটের তারিখ (শনি মে 16 23:58:44 UTC 2009)
  4. প্রশ্ন (lyx)। যদি কোন প্রশ্ন না থাকে, তাহলে এই মানটি হল NO_QUERY৷
  5. যে ব্যবহারকারী টুইট করেছেন (robotickilldozr)
  6. টুইটের পাঠ্য (লিক্স দুর্দান্ত)

আরও তথ্যের জন্য, https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf- এ দূরবর্তী তদারকি সহ Twitter সেন্টিমেন্ট ক্লাসিফিকেশন কাগজটি দেখুন

বিভক্ত উদাহরণ
'test' 498
'train' 1,600,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
তারিখ পাঠ্য স্ট্রিং
পোলারিটি টেনসর int32
প্রশ্ন পাঠ্য স্ট্রিং
পাঠ্য পাঠ্য স্ট্রিং
ব্যবহারকারী পাঠ্য স্ট্রিং
  • উদ্ধৃতি :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}