imagenet2012_subset

شرح :

Imagenet2012Subset زیر مجموعه ای از مجموعه داده اصلی ImageNet ILSVRC 2012 است. مجموعه داده از همان مجموعه اعتبارسنجی مجموعه داده اصلی ImageNet ILSVRC 2012 استفاده می کند. با این حال، مجموعه آموزشی به صورت متوازن برچسب زیر نمونه برداری می شود. در پیکربندی 1pct ، 1% یا 12811، تصاویر نمونه‌برداری می‌شوند، اکثر کلاس‌ها تعداد عکس‌های یکسانی دارند (متوسط 12.8)، برخی از کلاس‌ها به طور تصادفی 1 نمونه بیشتر از بقیه دارند. و در پیکربندی 10pct ، ~10% یا 128116، اکثر کلاس ها دارای تعداد یکسانی تصویر هستند (میانگین 128)، و برخی از کلاس ها به طور تصادفی 1 نمونه بیشتر از بقیه دارند.

این قرار است به عنوان معیاری برای یادگیری نیمه نظارتی استفاده شود و در اصل در مقاله SimCLR ( https://arxiv.org/abs/2002.05709 ) استفاده شده است.

صفحه اصلی : http://image-net.org/
کد منبع : tfds.datasets.imagenet2012_subset.Builder
نسخه ها :
- 2.0.0 : برچسب های اعتبار سنجی را برطرف کنید.
- 2.0.1 : رفع کدگذاری. هیچ تغییری از نظر کاربر وجود ندارد.
- 3.0.0 : رفع رنگ آمیزی در 12 تصویر (CMYK -> RGB). ثابت فرمت (تبدیل تصویر png به Jpeg). خواندن سریعتر نسل به طور مستقیم از آرشیو.
- 4.0.0 : (منتشر نشده)
- 5.0.0 (پیش‌فرض): API تقسیم جدید ( https://tensorflow.org/datasets/splits )
- 5.1.0 : تقسیم تست اضافه شد.
دستورالعمل‌های دانلود دستی : این مجموعه داده از شما می‌خواهد که داده‌های منبع را به صورت دستی در download_config.manual_dir دانلود کنید (پیش‌فرض ~/tensorflow_datasets/downloads/manual/ ):
manual_dir باید شامل دو فایل باشد: ILSVRC2012_img_train.tar و ILSVRC2012_img_val.tar. برای دریافت لینک دانلود مجموعه داده، باید در https://image-net.org/download-images ثبت نام کنید.
ذخیره خودکار ( اسناد ): خیر
ساختار ویژگی :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
نام فایل	متن		رشته
تصویر	تصویر	(هیچ، هیچ، 3)	uint8
برچسب	ClassLabel		int64

کلیدهای نظارت شده (مشاهده as_supervised doc ): ('image', 'label')
نقل قول :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}