Эта страница была переведа с помощью Cloud Translation API.
Switch to English

настроение140

  • Описание :

Sentiment140 позволяет узнать настроение бренда, продукта или темы в Twitter.

Данные представляют собой CSV-файл с удаленными смайликами. Формат файла данных имеет 6 полей:

  1. полярность твита (0 = отрицательный, 2 = нейтральный, 4 = положительный)
  2. идентификатор твита (2087)
  3. дата твита (сб, 16 мая, 23:58:44 UTC, 2009 г.)
  4. запрос (Lyx). Если запроса нет, то это значение NO_QUERY.
  5. пользователь, который написал твит (robotickilldozr)
  6. текст твита (Lyx крутой)

Для получения дополнительной информации см. Документ Twitter Sentiment Classification with Remote Supervision по адресу https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf.

Трещина Примеры
'test' 498
'train' 1,600,000
  • Особенности :
FeaturesDict({
    'date': Text(shape=(), dtype=tf.string),
    'polarity': tf.int32,
    'query': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'user': Text(shape=(), dtype=tf.string),
})
  • Контролируемые ключи (см. as_supervised doc ): ('text', 'polarity')

  • Цитата :

@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}