- شرح :
Imagenet2012Subset زیر مجموعه ای از مجموعه داده اصلی ImageNet ILSVRC 2012 است. مجموعه داده از همان مجموعه اعتبارسنجی مجموعه داده اصلی ImageNet ILSVRC 2012 استفاده می کند. با این حال، مجموعه آموزشی به صورت متوازن برچسب زیر نمونه برداری می شود. در پیکربندی 1pct
، 1% یا 12811، تصاویر نمونهبرداری میشوند، اکثر کلاسها تعداد عکسهای یکسانی دارند (متوسط 12.8)، برخی از کلاسها به طور تصادفی 1 نمونه بیشتر از بقیه دارند. و در پیکربندی 10pct
، ~10% یا 128116، اکثر کلاس ها دارای تعداد یکسانی تصویر هستند (میانگین 128)، و برخی از کلاس ها به طور تصادفی 1 نمونه بیشتر از بقیه دارند.
این قرار است به عنوان معیاری برای یادگیری نیمه نظارتی استفاده شود و در اصل در مقاله SimCLR ( https://arxiv.org/abs/2002.05709 ) استفاده شده است.
صفحه اصلی : http://image-net.org/
نسخه ها :
-
2.0.0
: برچسب های اعتبار سنجی را برطرف کنید. -
2.0.1
: رفع کدگذاری. هیچ تغییری از نظر کاربر وجود ندارد. 3.0.0
: رفع رنگ آمیزی در 12 تصویر (CMYK -> RGB). ثابت فرمت (تبدیل تصویر png به Jpeg). خواندن سریعتر نسل به طور مستقیم از آرشیو.4.0.0
: (منتشر نشده)5.0.0
(پیشفرض): API تقسیم جدید ( https://tensorflow.org/datasets/splits )5.1.0
: تقسیم تست اضافه شد.
-
دستورالعملهای دانلود دستی : این مجموعه داده از شما میخواهد که دادههای منبع را به صورت دستی در
download_config.manual_dir
دانلود کنید (پیشفرض~/tensorflow_datasets/downloads/manual/
):
manual_dir باید شامل دو فایل باشد: ILSVRC2012_img_train.tar و ILSVRC2012_img_val.tar. برای دریافت لینک دانلود مجموعه داده، باید در https://image-net.org/download-images ثبت نام کنید.ذخیره خودکار ( اسناد ): خیر
ساختار ویژگی :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
نام فایل | متن | رشته | ||
تصویر | تصویر | (هیچ، هیچ، 3) | uint8 | |
برچسب | ClassLabel | int64 |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('image', 'label')
نقل قول :
@article{chen2020simple,
title={A Simple Framework for Contrastive Learning of Visual Representations},
author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_subset/1pct (پیکربندی پیش فرض)
توضیحات پیکربندی : 1 درصد از کل مجموعه آموزشی ImageNet.
حجم دانلود :
254.22 KiB
حجم مجموعه داده :
7.61 GiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 12811 |
'validation' | 50000 |
- شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
imagenet2012_subset/10pct
توضیحات پیکربندی : 10 درصد از کل مجموعه آموزشی ImageNet.
حجم دانلود :
2.48 MiB
حجم مجموعه داده :
19.91 GiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 128,116 |
'validation' | 50000 |
- شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):