ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

ความรู้สึก140

  • รายละเอียด:

Sentiment140 ช่วยให้คุณค้นพบความรู้สึกของแบรนด์ ผลิตภัณฑ์ หรือหัวข้อบน Twitter

ข้อมูลเป็น CSV ที่ลบอีโมติคอน รูปแบบไฟล์ข้อมูลมี 6 ฟิลด์:

  1. ขั้วของทวีต (0 = ลบ, 2 = เป็นกลาง, 4 = บวก)
  2. รหัสของทวีต (2087)
  3. วันที่ทวีต (เสาร์ 16 พฤษภาคม 23:58:44 UTC 2009)
  4. แบบสอบถาม (lyx) หากไม่มีข้อความค้นหา ค่านี้คือ NO_QUERY
  5. ผู้ใช้ที่ทวีต (robottickilldozr)
  6. ข้อความของทวีต (Lyx เจ๋งมาก)

สำหรับข้อมูลเพิ่มเติมโปรดดูที่กระดาษการจำแนกประเภทความเชื่อมั่นทางไกล Twitter กับการกำกับดูแลที่ https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

แยก ตัวอย่าง
'test' 498
'train' 1,600,000
  • คุณสมบัติ:
FeaturesDict({
    'date': Text(shape=(), dtype=tf.string),
    'polarity': tf.int32,
    'query': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'user': Text(shape=(), dtype=tf.string),
})
  • อ้างอิง:
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}