एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

इमेजनेट2012

ILSVRC 2012, जिसे आमतौर पर 'इमेजनेट' के रूप में जाना जाता है, वर्डनेट पदानुक्रम के अनुसार व्यवस्थित एक छवि डेटासेट है। वर्डनेट में प्रत्येक सार्थक अवधारणा, जिसे संभवतः कई शब्दों या शब्द वाक्यांशों द्वारा वर्णित किया जाता है, को "समानार्थक सेट" या "सिंसेट" कहा जाता है। वर्डनेट में १००,००० से अधिक सिनसेट हैं, उनमें से अधिकांश संज्ञाएं (८०,०००+) हैं। इमेजनेट में, हमारा लक्ष्य प्रत्येक सिनसेट को दर्शाने के लिए औसतन 1000 छवियां प्रदान करना है। प्रत्येक अवधारणा की छवियां गुणवत्ता-नियंत्रित और मानव-एनोटेट हैं। इसके पूरा होने पर, हमें उम्मीद है कि इमेजनेट वर्डनेट पदानुक्रम में अधिकांश अवधारणाओं के लिए लाखों साफ-सुथरी छँटाई वाली छवियों की पेशकश करेगा।

परीक्षण विभाजन में 100K छवियां हैं लेकिन कोई लेबल नहीं है क्योंकि कोई भी लेबल सार्वजनिक रूप से जारी नहीं किया गया है। हम 10 अक्टूबर, 2019 को जारी किए गए मामूली पैच के साथ 2012 से परीक्षण विभाजन के लिए समर्थन प्रदान करते हैं। इस डेटा को मैन्युअल रूप से डाउनलोड करने के लिए, एक उपयोगकर्ता को निम्नलिखित कार्य करने होंगे:

  1. 2012 परीक्षण विभाजन उपलब्ध डाउनलोड यहाँ
  2. 10 अक्टूबर 2019 पैच डाउनलोड करें। उसी पृष्ठ पर प्रदान किए गए पैच के लिए एक Google ड्राइव लिंक है।
  3. पैच से छवियों के साथ मूल संग्रह में किसी भी छवि को मैन्युअल रूप से अधिलेखित करते हुए, दो टार-बॉल्स को मिलाएं। Image-net.org पर दिए गए निर्देशों के अनुसार, यह प्रक्रिया केवल कुछ छवियों को अधिलेखित कर देती है।

परिणामी टार-बॉल को तब TFDS द्वारा संसाधित किया जा सकता है।

इमेजनेट परीक्षण विभाजन पर एक मॉडल की सटीकता का आकलन करने के लिए, किसी को विभाजन में सभी छवियों पर अनुमान चलाना चाहिए, उन परिणामों को एक टेक्स्ट फ़ाइल में निर्यात करना चाहिए जिसे इमेजनेट मूल्यांकन सर्वर पर अपलोड किया जाना चाहिए। इमेजनेट मूल्यांकन सर्वर के अनुरक्षक ओवरफिटिंग को रोकने के लिए एकल उपयोगकर्ता को प्रति सप्ताह 2 सबमिशन सबमिट करने की अनुमति देते हैं।

परीक्षण विभाजन पर सटीकता का मूल्यांकन करने के लिए, पहले image-net.org पर एक खाता बनाना होगा। इस खाते को साइट व्यवस्थापक द्वारा अनुमोदित किया जाना चाहिए। बाद खाता बनाने के बाद से एक में परीक्षण सर्वर से परिणाम प्रस्तुत कर सकते हैं https://image-net.org/challenges/LSVRC/eval_server.php प्रस्तुत कई ASCII पाठ एकाधिक कार्य करने के लिए इसी फ़ाइलों के होते हैं। रुचि का कार्य "वर्गीकरण प्रस्तुत करना (शीर्ष -5 cls त्रुटि)" है। निर्यात की गई टेक्स्ट फ़ाइल का एक नमूना निम्न जैसा दिखता है:

771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168

: निर्यात स्वरूप 2013 विकास यहाँ उपलब्ध किट के भीतर "readme.txt" में पूर्ण रूप से वर्णन किया गया है http://imagenet.stanford.edu/image/ilsvrc2013/ILSVRC2013_devkit.tgz कृपया अनुभाग हकदार देख "3.3 सीएलएस-एलओसी प्रस्तुत प्रारूप ". संक्षेप में, पाठ फ़ाइल का प्रारूप परीक्षण विभाजन में प्रत्येक छवि के अनुरूप १००,००० पंक्तियाँ हैं। पूर्णांकों की प्रत्येक पंक्ति रैंक-आदेशित, प्रत्येक परीक्षण छवि के लिए शीर्ष 5 पूर्वानुमानों के अनुरूप होती है। पूर्णांक संबंधित लेबल फ़ाइल में पंक्ति संख्या के अनुरूप 1-अनुक्रमित होते हैं। देखें imagenet2012_labels.txt.

  • होमपेज: http://image-net.org/

  • स्रोत कोड: tfds.image_classification.Imagenet2012

  • संस्करण:

    • 2.0.0 : फिक्स सत्यापन लेबल।
    • 2.0.1 : ठीक एन्कोडिंग। उपयोगकर्ता के दृष्टिकोण से कोई परिवर्तन नहीं।
    • 3.0.0 : ~ 12 छवियों पर फिक्स colorization (सीएमवाइके -> आरजीबी)। स्थिरता के लिए प्रारूप को ठीक करें (एकल पीएनजी छवि को जेपीईजी में कनवर्ट करें)। संग्रह से सीधे पढ़ने वाली तेज़ पीढ़ी।

    • 4.0.0 : (अप्रकाशित)

    • 5.0.0 : नई विभाजन एपीआई ( https://tensorflow.org/datasets/splits )

    • 5.1.0 (डिफ़ॉल्ट): जोड़ा गया परीक्षण विभाजित।

  • डाउनलोड का आकार: Unknown size

  • डेटासेट का आकार: 155.84 GiB

  • मैनुअल डाउनलोड के निर्देश: यह डेटासेट आप में मैन्युअल रूप से स्रोत डेटा डाउनलोड करने के लिए की आवश्यकता है download_config.manual_dir (करने के लिए डिफ़ॉल्ट ~/tensorflow_datasets/downloads/manual/ ):
    मैन्युअल_डीआईआर में दो फाइलें होनी चाहिए: ILSVRC2012_img_train.tar और ILSVRC2012_img_val.tar। आप पर रजिस्टर करने की आवश्यकता http://www.image-net.org/download-images आदेश डाटासेट डाउनलोड करने के लिए लिंक प्राप्त करने के लिए।

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'test' 100,000
'train' 1,281,167
'validation' 50,000
  • विशेषताएं:
FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})

VISUALIZATION

  • प्रशस्ति पत्र:
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}