imagenet2012_subset

Imagenet2012Subset হল মূল ImageNet ILSVRC 2012 ডেটাসেটের একটি উপসেট। ডেটাসেটটি মূল ImageNet ILSVRC 2012 ডেটাসেটের মতো একই বৈধতা সেট শেয়ার করে৷ যাইহোক, প্রশিক্ষণ সেট একটি লেবেল সুষম ফ্যাশন সাবস্যাম্পল করা হয়. 1pct কনফিগারেশনে, 1%, বা 12811, চিত্রগুলি নমুনা করা হয়েছে, বেশিরভাগ ক্লাসে একই সংখ্যক চিত্র রয়েছে (গড় 12.8), কিছু ক্লাসে এলোমেলোভাবে অন্যদের তুলনায় 1টি বেশি উদাহরণ রয়েছে; এবং 10pct কনফিগারেশনে, ~10%, বা 128116, বেশিরভাগ ক্লাসে একই সংখ্যক চিত্র রয়েছে (গড় 128), এবং কিছু ক্লাসে এলোমেলোভাবে অন্যদের তুলনায় 1টি বেশি উদাহরণ রয়েছে।

এটি আধা-তত্ত্বাবধানে শেখার জন্য একটি মানদণ্ড হিসাবে ব্যবহৃত হওয়ার কথা, এবং এটি মূলত SimCLR কাগজে ব্যবহৃত হয়েছে ( https://arxiv.org/abs/2002.05709 )।

  • হোমপেজ : http://image-net.org/

  • সোর্স কোড : tfds.datasets.imagenet2012_subset.Builder

  • সংস্করণ :

    • 2.0.0 : বৈধতা লেবেল ঠিক করুন।
    • 2.0.1 : এনকোডিং ফিক্স। ব্যবহারকারীর দৃষ্টিকোণ থেকে কোন পরিবর্তন নেই।
    • 3.0.0 : ~12 ইমেজ (CMYK -> RGB) এর কালারাইজেশন ঠিক করুন। সামঞ্জস্যের জন্য বিন্যাস ঠিক করুন (একক পিএনজি চিত্রকে Jpeg এ রূপান্তর করুন)। আর্কাইভ থেকে সরাসরি প্রজন্মের দ্রুত পড়া।

    • 4.0.0 : (অপ্রকাশিত)

    • 5.0.0 (ডিফল্ট): নতুন স্প্লিট API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : টেস্ট স্প্লিট যোগ করা হয়েছে।

  • ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে download_config.manual_dir এ ম্যানুয়ালি উৎস ডেটা ডাউনলোড করতে হবে ( ~/tensorflow_datasets/downloads/manual/ এ ডিফল্ট):
    manual_dir-এ দুটি ফাইল থাকা উচিত: ILSVRC2012_img_train.tar এবং ILSVRC2012_img_val.tar। ডেটাসেট ডাউনলোড করার লিঙ্ক পেতে আপনাকে https://image-net.org/download-images- এ নিবন্ধন করতে হবে।

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বৈশিষ্ট্য গঠন :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
ফাইল_নাম পাঠ্য স্ট্রিং
ইমেজ ছবি (কোনটিই নয়, 3) uint8
লেবেল ক্লাসলেবেল int64
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): ('image', 'label')

  • উদ্ধৃতি :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (ডিফল্ট কনফিগারেশন)

  • কনফিগার বিবরণ : মোট ইমেজনেট প্রশিক্ষণ সেটের 1pct।

  • ডাউনলোড সাইজ : 254.22 KiB

  • ডেটাসেটের আকার : 7.61 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 12,811
'validation' 50,000

ভিজ্যুয়ালাইজেশন

imagenet2012_subset/10pct

  • কনফিগারের বিবরণ : মোট ইমেজনেট প্রশিক্ষণ সেটের 10pct।

  • ডাউনলোড সাইজ : 2.48 MiB

  • ডেটাসেটের আকার : 19.91 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 128,116
'validation' 50,000

ভিজ্যুয়ালাইজেশন