इमेजनेट2012

ILSVRC 2012, जिसे आमतौर पर 'इमेजनेट' के रूप में जाना जाता है, वर्डनेट पदानुक्रम के अनुसार व्यवस्थित एक इमेज डेटासेट है। वर्डनेट में प्रत्येक सार्थक अवधारणा, संभवतः कई शब्दों या शब्द वाक्यांशों द्वारा वर्णित है, जिसे "पर्यायवाची सेट" या "सिनसेट" कहा जाता है। वर्डनेट में 100,000 से अधिक सिंसेट हैं, उनमें से अधिकांश संज्ञा (80,000+) हैं। ImageNet में, हमारा लक्ष्य प्रत्येक सिंटसेट को चित्रित करने के लिए औसतन 1000 छवियां प्रदान करना है। प्रत्येक अवधारणा की छवियां गुणवत्ता-नियंत्रित और मानव-एनोटेट हैं। इसके पूरा होने में, हम आशा करते हैं कि इमेजनेट वर्डनेट पदानुक्रम में अधिकांश अवधारणाओं के लिए करोड़ों साफ-सुथरी क्रमबद्ध छवियां पेश करेगा।

परीक्षण विभाजन में 100K चित्र हैं लेकिन कोई लेबल नहीं है क्योंकि कोई भी लेबल सार्वजनिक रूप से जारी नहीं किया गया है। हम 10 अक्टूबर, 2019 को जारी मामूली पैच के साथ 2012 से परीक्षण विभाजन के लिए समर्थन प्रदान करते हैं। इस डेटा को मैन्युअल रूप से डाउनलोड करने के लिए, उपयोगकर्ता को निम्नलिखित कार्य करने होंगे:

  1. यहां उपलब्ध 2012 टेस्ट स्प्लिट को डाउनलोड करें
  2. 10 अक्टूबर, 2019 पैच डाउनलोड करें। उसी पृष्ठ पर प्रदान किए गए पैच के लिए एक Google ड्राइव लिंक है।
  3. पैच से छवियों के साथ मूल संग्रह में किसी भी छवि को मैन्युअल रूप से अधिलेखित करते हुए, दो टार-बॉल्स को मिलाएं। Image-net.org पर दिए गए निर्देशों के अनुसार, यह प्रक्रिया कुछ छवियों को अधिलेखित कर देती है।

परिणामी टार-बॉल को तब TFDS द्वारा संसाधित किया जा सकता है।

इमेजनेट टेस्ट स्प्लिट पर एक मॉडल की सटीकता का आकलन करने के लिए, किसी को स्प्लिट में सभी छवियों पर अनुमान लगाना चाहिए, उन परिणामों को एक टेक्स्ट फ़ाइल में निर्यात करना चाहिए जिसे इमेजनेट मूल्यांकन सर्वर पर अपलोड किया जाना चाहिए। ImageNet मूल्यांकन सर्वर के अनुरक्षक एक उपयोगकर्ता को ओवरफिटिंग को रोकने के लिए प्रति सप्ताह 2 सबमिशन जमा करने की अनुमति देते हैं।

परीक्षण विभाजन पर सटीकता का मूल्यांकन करने के लिए, पहले image-net.org पर एक खाता बनाना होगा। यह खाता साइट व्यवस्थापक द्वारा अनुमोदित होना चाहिए। खाता बनने के बाद, कोई भी व्यक्ति https://image-net.org/challenges/LSVRC/eval_server.php पर परीक्षण सर्वर पर परिणाम सबमिट कर सकता है। सबमिशन में कई कार्यों के अनुरूप कई ASCII टेक्स्ट फाइलें होती हैं। रुचि का कार्य "वर्गीकरण सबमिशन (शीर्ष -5 सीएलएस त्रुटि)" है। निर्यात की गई टेक्स्ट फ़ाइल का एक नमूना निम्न जैसा दिखता है:

771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168

निर्यात प्रारूप यहां उपलब्ध 2013 विकास किट के भीतर "readme.txt" में पूर्ण रूप से वर्णित है: https://image-net.org/data/ILSVRC/2013/ILSVRC2013_devkit.tgz कृपया "3.3 CLS-LOC" नामक अनुभाग देखें सबमिशन प्रारूप"। संक्षेप में, पाठ फ़ाइल का प्रारूप परीक्षण विभाजन में प्रत्येक छवि के अनुरूप 100,000 पंक्तियाँ हैं। पूर्णांकों की प्रत्येक पंक्ति रैंक-आदेशित, प्रत्येक परीक्षण छवि के लिए शीर्ष 5 भविष्यवाणियों के अनुरूप है। संबंधित लेबल फ़ाइल में पंक्ति संख्या के अनुरूप पूर्णांक 1-अनुक्रमित हैं। लेबल.txt देखें।

  • अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें

  • होमपेज : https://image-net.org/

  • स्रोत कोड : tfds.datasets.imagenet2012.Builder

  • संस्करण :

    • 2.0.0 : सत्यापन लेबल ठीक करें।
    • 2.0.1 : एन्कोडिंग फिक्स। उपयोगकर्ता के दृष्टिकोण से कोई बदलाव नहीं।
    • 3.0.0 : ~12 छवियों (CMYK -> RGB) पर रंगीकरण ठीक करें। स्थिरता के लिए प्रारूप को ठीक करें (एकल पीएनजी इमेज को जेपीईजी में बदलें)। तेज पीढ़ी सीधे संग्रह से पढ़ रही है।

    • 4.0.0 : (अप्रकाशित)

    • 5.0.0 : नया स्प्लिट एपीआई ( https://tensorflow.org/datasets/splits )

    • 5.1.0 (डिफ़ॉल्ट): जोड़ा गया परीक्षण विभाजन।

  • डाउनलोड आकार : Unknown size

  • डेटासेट का आकार : 155.84 GiB

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    मैन्युअल_डीआईआर में दो फाइलें होनी चाहिए: ILSVRC2012_img_train.tar और ILSVRC2012_img_val.tar। डेटासेट डाउनलोड करने के लिए लिंक प्राप्त करने के लिए आपको https://image-net.org/download-images पर पंजीकरण करना होगा।

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'test' 100,000
'train' 1,281,167
'validation' 50,000
  • फ़ीचर संरचना :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
फ़ाइल का नाम मूलपाठ डोरी
छवि छवि (कोई नहीं, कोई नहीं, 3) uint8
लेबल क्लासलेबल int64

VISUALIZATION

  • उद्धरण :
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}