احساسات140

  • توضیحات :

Sentiment140 به شما امکان می دهد احساسات یک برند، محصول یا موضوع را در توییتر کشف کنید.

داده ها یک CSV با شکلک های حذف شده است. فرمت فایل داده دارای 6 فیلد است:

  1. قطبیت توییت (0 = منفی، 2 = خنثی، 4 = مثبت)
  2. شناسه توییت (2087)
  3. تاریخ توییت (شنبه 16 مه 23:58:44 UTC 2009)
  4. پرس و جو (لیکس). اگر درخواستی وجود نداشته باشد، این مقدار NO_QUERY است.
  5. کاربری که توییت کرده است (robotickilldozr)
  6. متن توییت (Lyx جالب است)

برای اطلاعات بیشتر، به مقاله طبقه بندی احساسات توییتر با نظارت از راه دور در https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf مراجعه کنید .

شکاف مثال ها
'test' 498
'train' 1,600,000
  • ساختار ویژگی :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تاریخ متن رشته
قطبیت تانسور int32
پرس و جو متن رشته
متن متن رشته
کاربر متن رشته
  • نقل قول :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}