imagenet2012_subset

  • شرح :

Imagenet2012Subset زیر مجموعه ای از مجموعه داده اصلی ImageNet ILSVRC 2012 است. مجموعه داده از همان مجموعه اعتبارسنجی مجموعه داده اصلی ImageNet ILSVRC 2012 استفاده می کند. با این حال، مجموعه آموزشی به صورت متوازن برچسب زیر نمونه برداری می شود. در پیکربندی 1pct ، 1% یا 12811، تصاویر نمونه‌برداری می‌شوند، اکثر کلاس‌ها تعداد عکس‌های یکسانی دارند (متوسط ​​12.8)، برخی از کلاس‌ها به طور تصادفی 1 نمونه بیشتر از بقیه دارند. و در پیکربندی 10pct ، ~10% یا 128116، اکثر کلاس ها دارای تعداد یکسانی تصویر هستند (میانگین 128)، و برخی از کلاس ها به طور تصادفی 1 نمونه بیشتر از بقیه دارند.

این قرار است به عنوان معیاری برای یادگیری نیمه نظارتی استفاده شود و در اصل در مقاله SimCLR ( https://arxiv.org/abs/2002.05709 ) استفاده شده است.

  • صفحه اصلی : http://image-net.org/

  • کد منبع : tfds.datasets.imagenet2012_subset.Builder

  • نسخه ها :

    • 2.0.0 : برچسب های اعتبار سنجی را برطرف کنید.
    • 2.0.1 : رفع کدگذاری. هیچ تغییری از نظر کاربر وجود ندارد.
    • 3.0.0 : رفع رنگ آمیزی در 12 تصویر (CMYK -> RGB). ثابت فرمت (تبدیل تصویر png به Jpeg). خواندن سریعتر نسل به طور مستقیم از آرشیو.

    • 4.0.0 : (منتشر نشده)

    • 5.0.0 (پیش‌فرض): API تقسیم جدید ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : تقسیم تست اضافه شد.

  • دستورالعمل‌های دانلود دستی : این مجموعه داده از شما می‌خواهد که داده‌های منبع را به صورت دستی در download_config.manual_dir دانلود کنید (پیش‌فرض ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir باید شامل دو فایل باشد: ILSVRC2012_img_train.tar و ILSVRC2012_img_val.tar. برای دریافت لینک دانلود مجموعه داده، باید در https://image-net.org/download-images ثبت نام کنید.

  • ذخیره خودکار ( اسناد ): خیر

  • ساختار ویژگی :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
نام فایل متن رشته
تصویر تصویر (هیچ، هیچ، 3) uint8
برچسب ClassLabel int64
  • کلیدهای نظارت شده (مشاهده as_supervised doc ): ('image', 'label')

  • نقل قول :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (پیکربندی پیش فرض)

  • توضیحات پیکربندی : 1 درصد از کل مجموعه آموزشی ImageNet.

  • حجم دانلود : 254.22 KiB

  • حجم مجموعه داده : 7.61 GiB

  • تقسیم ها :

شکاف مثال ها
'train' 12811
'validation' 50000

تجسم

imagenet2012_subset/10pct

  • توضیحات پیکربندی : 10 درصد از کل مجموعه آموزشی ImageNet.

  • حجم دانلود : 2.48 MiB

  • حجم مجموعه داده : 19.91 GiB

  • تقسیم ها :

شکاف مثال ها
'train' 128,116
'validation' 50000

تجسم