09:00 पीएसटी पर एमएल संगोष्ठी इस मंगलवार, 19 अक्टूबर में पहले महिलाओं में ट्यून रजिस्टर अब

सिफार10_1

CIFAR-10.1 डेटासेट CIFAR-10 के लिए एक नया परीक्षण सेट है। CIFAR-10.1 में लगभग 2,000 नई परीक्षण छवियां शामिल हैं जिन्हें मूल CIFAR-10 डेटासेट पर कई वर्षों के शोध के बाद नमूना लिया गया था। CIFAR-10.1 के लिए डेटा संग्रह को मूल डेटासेट के सापेक्ष वितरण बदलाव को कम करने के लिए डिज़ाइन किया गया था। हम CIFAR-10.1 के निर्माण का वर्णन "Do CIFAR-10 Classifiers Generalize to CIFAR-10?" पेपर में करते हैं। CIFAR-10.1 में छवियां TinyImages डेटासेट का सबसेट हैं। वर्तमान में CIFAR-10.1 डेटासेट के दो संस्करण हैं: v4 और v6।

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • पर्यवेक्षित कुंजियों (देखें as_supervised डॉक ): ('image', 'label')

  • प्रशस्ति पत्र:

@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (डिफ़ॉल्ट कॉन्फ़िग)

  • कॉन्फ़िग वर्णन: यह हमारे डाटासेट जिस पर हम किसी भी वर्गीकारक परीक्षण किया के पहले संस्करण है। जैसा कि ऊपर उल्लेख किया गया है, यह v4 डेटासेट को हमारे द्वारा मूल्यांकन किए जाने वाले क्लासिफायर से स्वतंत्र बनाता है। हमारे पेपर के मुख्य भाग में रिपोर्ट किए गए नंबर डेटासेट के इस संस्करण का उपयोग करते हैं। यह प्रत्येक वर्ग के लिए शीर्ष 25 TinyImages कीवर्ड से बनाया गया था, जिसके कारण थोड़ा सा वर्ग असंतुलन हुआ। सबसे बड़ा अंतर यह है कि जहाज 10% के बजाय परीक्षण सेट का केवल 8% बनाते हैं। v4 में 2,021 चित्र हैं।

  • डाउनलोड का आकार: 5.93 MiB

  • डेटासेट का आकार: 4.46 MiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 2,021

VISUALIZATION

सिफार10_1/v6

  • कॉन्फ़िग वर्णन: यह एक थोड़ा सुधार कीवर्ड आवंटन वर्ग संतुलित है कि वास्तव में से ली गई है। डेटासेट का यह संस्करण हमारे पेपर के परिशिष्ट D के परिणामों से मेल खाता है। v6 में 2,000 छवियां हैं।

  • डाउनलोड का आकार: 5.87 MiB

  • डेटासेट का आकार: 4.40 MiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 2,000

VISUALIZATION