imagenet2012

ILSVRC 2012, সাধারণত 'ImageNet' নামে পরিচিত একটি ইমেজ ডেটাসেট WordNet শ্রেণীবিন্যাস অনুসারে সংগঠিত৷ WordNet-এ প্রতিটি অর্থপূর্ণ ধারণা, সম্ভবত একাধিক শব্দ বা শব্দ বাক্যাংশ দ্বারা বর্ণিত, একটি "সমার্থক সেট" বা "সিনসেট" বলা হয়। WordNet-এ 100,000 টিরও বেশি সিসেট রয়েছে, তাদের বেশিরভাগই বিশেষ্য (80,000+)। ImageNet-এ, আমরা প্রতিটি সিন্সেটকে চিত্রিত করার জন্য গড়ে 1000টি ছবি প্রদান করার লক্ষ্য রাখি। প্রতিটি ধারণার ছবি মান-নিয়ন্ত্রিত এবং মানব-টীকাযুক্ত। এর সমাপ্তিতে, আমরা আশা করি ইমেজনেট WordNet অনুক্রমের বেশিরভাগ ধারণার জন্য লক্ষ লক্ষ পরিষ্কারভাবে সাজানো ছবি অফার করবে।

টেস্ট স্প্লিটে 100K ছবি রয়েছে কিন্তু কোনো লেবেল নেই কারণ কোনো লেবেল সর্বজনীনভাবে প্রকাশ করা হয়নি। আমরা 2012 থেকে 10 অক্টোবর, 2019-এ প্রকাশিত ছোটখাট প্যাচের সাথে পরীক্ষা বিভক্ত করার জন্য সমর্থন প্রদান করি। এই ডেটা ম্যানুয়ালি ডাউনলোড করার জন্য, একজন ব্যবহারকারীকে নিম্নলিখিত ক্রিয়াকলাপগুলি সম্পাদন করতে হবে:

  1. এখানে উপলব্ধ 2012 টেস্ট স্প্লিট ডাউনলোড করুন।
  2. অক্টোবর 10, 2019 প্যাচ ডাউনলোড করুন। একই পৃষ্ঠায় দেওয়া প্যাচটিতে একটি Google ড্রাইভ লিঙ্ক রয়েছে।
  3. দুটি টার-বল একত্রিত করুন, ম্যানুয়ালি মূল আর্কাইভের যেকোনো ছবিকে প্যাচের ছবি দিয়ে ওভাররাইট করুন। image-net.org-এর নির্দেশাবলী অনুসারে, এই পদ্ধতিটি মাত্র কয়েকটি ছবি ওভাররাইট করে।

ফলে টার-বল টিএফডিএস দ্বারা প্রক্রিয়া করা হতে পারে।

ইমেজনেট টেস্ট স্প্লিটে একটি মডেলের নির্ভুলতা মূল্যায়ন করতে, একজনকে অবশ্যই বিভাজনের সমস্ত চিত্রের অনুমান চালাতে হবে, সেই ফলাফলগুলিকে একটি পাঠ্য ফাইলে রপ্তানি করতে হবে যা অবশ্যই ইমেজনেট মূল্যায়ন সার্ভারে আপলোড করতে হবে। ইমেজনেট মূল্যায়ন সার্ভারের রক্ষণাবেক্ষণকারীরা অতিরিক্ত ফিটিং প্রতিরোধ করার জন্য একজন একক ব্যবহারকারীকে প্রতি সপ্তাহে 2টি পর্যন্ত জমা দেওয়ার অনুমতি দেয়।

পরীক্ষার বিভাজনে নির্ভুলতা মূল্যায়ন করতে, একজনকে প্রথমে image-net.org এ একটি অ্যাকাউন্ট তৈরি করতে হবে। এই অ্যাকাউন্টটি অবশ্যই সাইট অ্যাডমিনিস্ট্রেটর দ্বারা অনুমোদিত হতে হবে। অ্যাকাউন্ট তৈরি হওয়ার পরে, কেউ https://image-net.org/challenges/LSVRC/eval_server.php- এ পরীক্ষার সার্ভারে ফলাফল জমা দিতে পারে জমাটি একাধিক কাজের সাথে সম্পর্কিত একাধিক ASCII পাঠ্য ফাইল নিয়ে গঠিত। আগ্রহের কাজটি হল "শ্রেণীবিন্যাস জমা দেওয়া (টপ-5 সিএলএস ত্রুটি)"। একটি রপ্তানি করা পাঠ্য ফাইলের একটি নমুনা নিম্নলিখিত মত দেখায়:

771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168

রপ্তানি বিন্যাসটি এখানে উপলব্ধ 2013 ডেভেলপমেন্ট কিটের মধ্যে "readme.txt" এ সম্পূর্ণ বর্ণনা করা হয়েছে: https://image-net.org/data/ILSVRC/2013/ILSVRC2013_devkit.tgz অনুগ্রহ করে "3.3 CLS-LOC" শিরোনামের বিভাগটি দেখুন জমা দেওয়ার বিন্যাস"। সংক্ষিপ্তভাবে, টেক্সট ফাইলের বিন্যাস হল 100,000 লাইন পরীক্ষা বিভাজনের প্রতিটি চিত্রের সাথে সম্পর্কিত। পূর্ণসংখ্যার প্রতিটি লাইন প্রতিটি পরীক্ষার চিত্রের জন্য শীর্ষ 5 ভবিষ্যদ্বাণী র্যাঙ্ক-অর্ডার-এর সাথে মিলে যায়। পূর্ণসংখ্যাগুলি সংশ্লিষ্ট লেবেল ফাইলের লাইন নম্বরের সাথে 1-সূচীযুক্ত। labels.txt দেখুন।

  • অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন

  • হোমপেজ : https://image-net.org/

  • সোর্স কোড : tfds.datasets.imagenet2012.Builder

  • সংস্করণ :

    • 2.0.0 : বৈধতা লেবেল ঠিক করুন।
    • 2.0.1 : এনকোডিং ফিক্স। ব্যবহারকারীর দৃষ্টিকোণ থেকে কোন পরিবর্তন নেই।
    • 3.0.0 : ~12 ইমেজ (CMYK -> RGB) এর কালারাইজেশন ঠিক করুন। সামঞ্জস্যের জন্য বিন্যাস ঠিক করুন (একক পিএনজি চিত্রকে Jpeg এ রূপান্তর করুন)। আর্কাইভ থেকে সরাসরি প্রজন্মের দ্রুত পড়া।

    • 4.0.0 : (অপ্রকাশিত)

    • 5.0.0 : নতুন স্প্লিট API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 (ডিফল্ট): টেস্ট স্প্লিট যোগ করা হয়েছে।

  • ডাউনলোড আকার : Unknown size

  • ডেটাসেটের আকার : 155.84 GiB

  • ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে ডাউনলোড_config.manual_dir-এ ম্যানুয়ালি উৎস ডেটা download_config.manual_dir করতে হবে ( ~/tensorflow_datasets/downloads/manual/ ডিফল্ট):
    manual_dir-এ দুটি ফাইল থাকা উচিত: ILSVRC2012_img_train.tar এবং ILSVRC2012_img_val.tar। ডেটাসেট ডাউনলোড করার লিঙ্ক পেতে আপনাকে https://image-net.org/download-images- এ নিবন্ধন করতে হবে।

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 100,000
'train' 1,281,167
'validation' 50,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
ফাইল_নাম পাঠ্য স্ট্রিং
ইমেজ ছবি (কোনটিই নয়, 3) uint8
লেবেল ক্লাসলেবেল int64

ভিজ্যুয়ালাইজেশন

  • উদ্ধৃতি :
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}