09:00 पीएसटी पर एमएल संगोष्ठी इस मंगलवार, 19 अक्टूबर में पहले महिलाओं में ट्यून रजिस्टर अब

एसटीएल10

  • विवरण:

STL-10 डेटासेट एक इमेज रिकग्निशन डेटासेट है जो बिना पर्यवेक्षित फीचर लर्निंग, डीप लर्निंग, सेल्फ-टीच लर्निंग एल्गोरिदम विकसित करने के लिए है। यह CIFAR-10 डेटासेट से प्रेरित है लेकिन कुछ संशोधनों के साथ। विशेष रूप से, प्रत्येक वर्ग में CIFAR-10 की तुलना में कम लेबल वाले प्रशिक्षण उदाहरण हैं, लेकिन पर्यवेक्षित प्रशिक्षण से पहले छवि मॉडल सीखने के लिए बिना लेबल वाले उदाहरणों का एक बहुत बड़ा सेट प्रदान किया जाता है। प्राथमिक चुनौती एक उपयोगी पूर्व बनाने के लिए बिना लेबल वाले डेटा (जो लेबल किए गए डेटा से समान लेकिन अलग वितरण से आता है) का उपयोग करना है। सभी चित्र ImageNet पर लेबल किए गए उदाहरणों से प्राप्त किए गए थे।

विभाजित करना उदाहरण
'test' 8,000
'train' 5,000
'unlabelled' 100,000
  • विशेषताएं:
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})

VISUALIZATION

  • प्रशस्ति पत्र:
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}