Визуализация : Исследуйте в Know Your Data
Описание :
Imagenet2012Subset — это подмножество исходного набора данных ImageNet ILSVRC 2012. Набор данных использует тот же набор проверки, что и исходный набор данных ImageNet ILSGRC 2012. Тем не менее, обучающая выборка субдискретизируется сбалансированным образом по меткам. В конфигурации 1pct
выбирается 1% или 12811 изображений, большинство классов имеют одинаковое количество изображений (в среднем 12,8), некоторые классы случайным образом имеют на 1 образец больше, чем другие; и в конфигурации 10pct
, ~10%, или 128116, большинство классов имеют одинаковое количество изображений (в среднем 128), а некоторые классы случайным образом имеют на 1 образец больше, чем другие.
Предполагается, что это будет использоваться в качестве эталона для полуконтролируемого обучения и первоначально использовалось в статье SimCLR ( https://arxiv.org/abs/2002.05709 ).
Домашняя страница : http://image-net.org/
Исходный код :
tfds.datasets.imagenet2012_subset.Builder
Версии :
-
2.0.0
: Исправлены метки проверки. -
2.0.1
: Исправление кодировки. Никаких изменений с точки зрения пользователя. 3.0.0
: исправление раскрашивания примерно на 12 изображениях (CMYK -> RGB). Исправьте формат для согласованности (конвертируйте одиночное изображение png в Jpeg). Более быстрое чтение генерации прямо из архива.4.0.0
: (неопубликовано)5.0.0
(по умолчанию): новый раздельный API ( https://tensorflow.org/datasets/splits )5.1.0
: Добавлен тестовый сплит.
-
Инструкции по ручной загрузке : этот набор данных требует, чтобы вы загружали исходные данные вручную в
download_config.manual_dir
(по умолчанию~/tensorflow_datasets/downloads/manual/
):
manual_dir должен содержать два файла: ILSVRC2012_img_train.tar и ILSVRC2012_img_val.tar. Вам необходимо зарегистрироваться на https://image-net.org/download-images , чтобы получить ссылку для загрузки набора данных.Автоматическое кэширование ( документация ): Нет
Структура функции :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
имя файла | Текст | нить | ||
изображение | Изображение | (Нет, Нет, 3) | uint8 | |
этикетка | Метка класса | int64 |
Контролируемые ключи (см. документ
as_supervised
):('image', 'label')
Цитата :
@article{chen2020simple,
title={A Simple Framework for Contrastive Learning of Visual Representations},
author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_subset/1pct (конфигурация по умолчанию)
Описание конфигурации : 1% всего тренировочного набора ImageNet.
Размер загрузки :
254.22 KiB
Размер набора данных :
7.61 GiB
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 12 811 |
'validation' | 50 000 |
- Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
imagenet2012_subset/10pct
Описание конфигурации : 10% от общего набора для обучения ImageNet.
Размер загрузки :
2.48 MiB
Размер набора данных :
19.91 GiB
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 128 116 |
'validation' | 50 000 |
- Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):