imagenet2012_subset

Описание :

Imagenet2012Subset — это подмножество исходного набора данных ImageNet ILSVRC 2012. Набор данных использует тот же набор проверок, что и исходный набор данных ImageNet ILSVRC 2012. Однако обучающий набор формируется сбалансированным по меткам способом. В конфигурации 1pct , 1% или 12811, изображения выбираются, большинство классов имеют одинаковое количество изображений (в среднем 12,8), некоторые классы случайным образом имеют на 1 пример больше, чем другие; а в конфигурации 10pct , ~10% или 128116, большинство классов имеют одинаковое количество изображений (в среднем 128), а некоторые классы случайным образом содержат на 1 пример больше, чем другие.

Предполагается, что это будет использоваться в качестве эталона для полуконтролируемого обучения и первоначально использовалось в документе SimCLR ( https://arxiv.org/abs/2002.05709 ).

Домашняя страница : http://image-net.org/
Исходный код : tfds.datasets.imagenet2012_subset.Builder
Версии :
- 2.0.0 : исправлены метки проверки.
- 2.0.1 : Исправление кодировки. Никаких изменений с точки зрения пользователя.
- 3.0.0 : исправлена раскраска примерно 12 изображений (CMYK -> RGB). Исправьте формат для обеспечения единообразия (конвертируйте одно изображение PNG в Jpeg). Ускоренное чтение генерации прямо из архива.
- 4.0.0 : (неопубликовано)
- 5.0.0 (по умолчанию): новый API разделения ( https://tensorflow.org/datasets/splits )
- 5.1.0 : Добавлено тестовое разделение.
Инструкции по загрузке вручную : этот набор данных требует, чтобы вы вручную загрузили исходные данные в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
manual_dir должен содержать два файла: ILSVRC2012_img_train.tar и ILSVRC2012_img_val.tar. Вам необходимо зарегистрироваться на https://image-net.org/download-images , чтобы получить ссылку для загрузки набора данных.
Автокэширование ( документация ): Нет
Структура функции :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})

Функциональная документация :

Особенность	Сорт	Форма	Дтип
	ВозможностиDict
имя файла	Текст		нить
изображение	Изображение	(Нет, Нет, 3)	uint8
этикетка	Класслейбл		int64

Контролируемые ключи (см. документ as_supervised ): ('image', 'label')
Цитата :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (конфигурация по умолчанию)

Описание конфигурации : 1 процент от общего набора обучающих программ ImageNet.
Размер загрузки : 254.22 KiB
Размер набора данных : 7.61 GiB
Расколы :

Расколоть	Примеры
`'train'`	12 811
`'validation'`	50 000

Рисунок ( tfds.show_examples ):

Визуализация

Примеры ( tfds.as_dataframe ):

imagenet2012_subset/10%

Описание конфигурации : 10% от общего обучающего набора ImageNet.
Размер загрузки : 2.48 MiB
Размер набора данных : 19.91 GiB
Расколы :

Расколоть	Примеры
`'train'`	128 116
`'validation'`	50 000

Рисунок ( tfds.show_examples ):

Визуализация

Примеры ( tfds.as_dataframe ):