एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

इमेजनेट2012_सबसेट

Imagenet2012Subset मूल ImageNet ILSVRC 2012 डेटासेट का सबसेट है। डाटासेट शेयर मूल ImageNet ILSVRC 2012 डाटासेट के रूप में ही मान्यता सेट। हालांकि, प्रशिक्षण सेट को एक लेबल संतुलित फैशन में सब-सैंपल किया गया है। में 1pct विन्यास, 1%, या 12811, छवियों नमूने दिए जाते हैं, अधिकांश वर्गों छवियों (औसत 12.8) की एक ही नंबर है, कुछ वर्गों को बेतरतीब ढंग से दूसरों की तुलना में 1 और उदाहरण है; और में 10pct विन्यास, ~ 10%, या 128,116, अधिकांश वर्गों छवियों (औसत 128) की एक ही नंबर है, और कुछ वर्गों बेतरतीब ढंग से दूसरों की तुलना में 1 और उदाहरण है।

इस अर्द्ध देखरेख सीखने के लिए एक मानक के रूप में इस्तेमाल किया जा माना जाता है, और मूल रूप से SimCLR पत्र में इस्तेमाल किया गया है ( https://arxiv.org/abs/2002.05709 )।

  • होमपेज: http://image-net.org/

  • स्रोत कोड: tfds.image_classification.Imagenet2012Subset

  • संस्करण:

    • 2.0.0 : फिक्स सत्यापन लेबल।
    • 2.0.1 : ठीक एन्कोडिंग। उपयोगकर्ता के दृष्टिकोण से कोई परिवर्तन नहीं।
    • 3.0.0 : ~ 12 छवियों पर फिक्स colorization (सीएमवाइके -> आरजीबी)। स्थिरता के लिए प्रारूप को ठीक करें (एकल पीएनजी छवि को जेपीईजी में कनवर्ट करें)। संग्रह से सीधे पढ़ने वाली तेज़ पीढ़ी।

    • 4.0.0 : (अप्रकाशित)

    • 5.0.0 (डिफ़ॉल्ट): न्यू विभाजन एपीआई ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : जोड़ा गया परीक्षण विभाजित।

  • मैनुअल डाउनलोड के निर्देश: यह डेटासेट आप में मैन्युअल रूप से स्रोत डेटा डाउनलोड करने के लिए की आवश्यकता है download_config.manual_dir (करने के लिए डिफ़ॉल्ट ~/tensorflow_datasets/downloads/manual/ ):
    मैन्युअल_डीआईआर में दो फाइलें होनी चाहिए: ILSVRC2012_img_train.tar और ILSVRC2012_img_val.tar। आप पर रजिस्टर करने की आवश्यकता http://www.image-net.org/download-images आदेश डाटासेट डाउनलोड करने के लिए लिंक प्राप्त करने के लिए।

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विशेषताएं:

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
  • पर्यवेक्षित कुंजियों (देखें as_supervised डॉक ): ('image', 'label')

  • प्रशस्ति पत्र:

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (डिफ़ॉल्ट कॉन्फ़िग)

  • कॉन्फ़िग विवरण: कुल ImageNet प्रशिक्षण सेट की 1pct।

  • डाउनलोड का आकार: 254.22 KiB

  • डेटासेट का आकार: 7.61 GiB

  • विभाजन:

विभाजित करना उदाहरण
'train' १२,८११
'validation' 50,000

VISUALIZATION

इमेजनेट2012_सबसेट/10पीसीटी

  • कॉन्फ़िग विवरण: कुल ImageNet प्रशिक्षण सेट की 10pct।

  • डाउनलोड का आकार: 2.48 MiB

  • डेटासेट का आकार: 19.91 GiB

  • विभाजन:

विभाजित करना उदाहरण
'train' 128,116
'validation' 50,000

VISUALIZATION