امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

yelp_polarity_reviews

  • توضیحات :

مجموعه بزرگ بررسی Yelp. این یک مجموعه داده برای طبقه بندی احساسات باینری است. ما مجموعه ای از 560،000 بررسی بسیار خوب قطب یمن را برای آموزش و 38،000 را برای آزمایش ارائه می دهیم. ORIGIN مجموعه داده های بررسیهای Yelp شامل بررسیهای Yelp است. از داده های Yelp Dataset Challenge 2015 استخراج شده است. برای اطلاعات بیشتر ، لطفاً به http://www.yelp.com/dataset مراجعه کنید

مجموعه داده های قطبی بررسی Yelp توسط شیانگ ژانگ (xiang.zhang@nyu.edu) از مجموعه داده فوق ساخته شده است. این اولین بار به عنوان معیار طبقه بندی متن در مقاله زیر استفاده می شود: شیانگ ژانگ ، جونبو ژائو ، یان لکون. شبکه های پیوندی در سطح شخصیت برای طبقه بندی متن. پیشرفت در سیستم های پردازش اطلاعات عصبی 28 (NIPS 2015).

شرح

مجموعه داده های قطبی بررسی Yelp با در نظر گرفتن ستاره های 1 و 2 منفی و 3 و 4 مثبت ساخته شده است. برای هر قطب 280،000 نمونه آموزش و 19،000 نمونه آزمایش بصورت تصادفی گرفته می شود. در مجموع 560،000 نمونه trainig و 38،000 نمونه آزمایش وجود دارد. قطب منفی کلاس 1 و کلاس مثبت 2 است.

پرونده های train.csv و test.csv حاوی تمام نمونه های آموزشی به عنوان مقادیر کاما هستند. در آنها 2 ستون وجود دارد که مربوط به فهرست کلاس (1 و 2) و متن بازبینی است. از متن بازبینی با استفاده از نقل قول های مضاعف (") فرار می شود ، و هر نقل قول داخلی با 2 نقل قول های مضاعف (" ") فرار می کند. خطوط جدید با یک بک اسلش که با شخصیت" n "دنبال می شود ، یعنی" "فرار می کنند.

شکاف مثال ها
'test' 38000
'train' 560،000
  • ویژگی ها :
FeaturesDict({
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'text': Text(shape=(), dtype=tf.string),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('text', 'label')

  • نقل قول :

@article{zhangCharacterlevelConvolutionalNetworks2015,
  archivePrefix = {arXiv},
  eprinttype = {arxiv},
  eprint = {1509.01626},
  primaryClass = {cs},
  title = {Character-Level { {Convolutional Networks} } for { {Text Classification} } },
  abstract = {This article offers an empirical exploration on the use of character-level convolutional networks (ConvNets) for text classification. We constructed several large-scale datasets to show that character-level convolutional networks could achieve state-of-the-art or competitive results. Comparisons are offered against traditional models such as bag of words, n-grams and their TFIDF variants, and deep learning models such as word-based ConvNets and recurrent neural networks.},
  journal = {arXiv:1509.01626 [cs]},
  author = {Zhang, Xiang and Zhao, Junbo and LeCun, Yann},
  month = sep,
  year = {2015},
}