المشاعر 140

  • الوصف :

يسمح لك Sentiment140 باكتشاف شعور العلامة التجارية أو المنتج أو الموضوع على Twitter.

البيانات عبارة عن ملف CSV مع إزالة الرموز. يحتوي تنسيق ملف البيانات على 6 حقول:

  1. قطبية التغريدة (0 = سلبي ، 2 = محايد ، 4 = إيجابي)
  2. معرف التغريدة (2087)
  3. تاريخ التغريدة (السبت 16 مايو 23:58:44 بالتوقيت العالمي المنسق 2009)
  4. الاستعلام (ليكس). إذا لم يكن هناك استعلام ، فهذه القيمة هي NO_QUERY.
  5. المستخدم الذي غرد (robotickilldozr)
  6. نص التغريدة (Lyx رائع)

لمزيد من المعلومات ، راجع مقالة تصنيف مشاعر Twitter مع الإشراف البعيد على https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

انشق، مزق أمثلة
'test' 498
'train' 1،600،000
  • هيكل الميزة :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
تاريخ نص سلسلة
قطبية موتر int32
استفسار نص سلسلة
نص نص سلسلة
المستعمل نص سلسلة
  • الاقتباس :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}