imagenet2012_subset

Imagenet2012Subset — это подмножество исходного набора данных ImageNet ILSVRC 2012. Набор данных использует тот же набор проверки, что и исходный набор данных ImageNet ILSGRC 2012. Тем не менее, обучающая выборка субдискретизируется сбалансированным образом по меткам. В конфигурации 1pct выбирается 1% или 12811 изображений, большинство классов имеют одинаковое количество изображений (в среднем 12,8), некоторые классы случайным образом имеют на 1 образец больше, чем другие; и в конфигурации 10pct , ~10%, или 128116, большинство классов имеют одинаковое количество изображений (в среднем 128), а некоторые классы случайным образом имеют на 1 образец больше, чем другие.

Предполагается, что это будет использоваться в качестве эталона для полуконтролируемого обучения и первоначально использовалось в статье SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Домашняя страница : http://image-net.org/

  • Исходный код : tfds.datasets.imagenet2012_subset.Builder

  • Версии :

    • 2.0.0 : Исправлены метки проверки.
    • 2.0.1 : Исправление кодировки. Никаких изменений с точки зрения пользователя.
    • 3.0.0 : исправление раскрашивания примерно на 12 изображениях (CMYK -> RGB). Исправьте формат для согласованности (конвертируйте одиночное изображение png в Jpeg). Более быстрое чтение генерации прямо из архива.

    • 4.0.0 : (неопубликовано)

    • 5.0.0 (по умолчанию): новый раздельный API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Добавлен тестовый сплит.

  • Инструкции по ручной загрузке : этот набор данных требует, чтобы вы загружали исходные данные вручную в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir должен содержать два файла: ILSVRC2012_img_train.tar и ILSVRC2012_img_val.tar. Вам необходимо зарегистрироваться на https://image-net.org/download-images , чтобы получить ссылку для загрузки набора данных.

  • Автоматическое кэширование ( документация ): Нет

  • Структура функции :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
имя файла Текст нить
изображение Изображение (Нет, Нет, 3) uint8
этикетка Метка класса int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (конфигурация по умолчанию)

  • Описание конфигурации : 1% всего тренировочного набора ImageNet.

  • Размер загрузки : 254.22 KiB

  • Размер набора данных : 7.61 GiB

  • Сплиты :

Расколоть Примеры
'train' 12 811
'validation' 50 000

Визуализация

imagenet2012_subset/10pct

  • Описание конфигурации : 10% от общего набора для обучения ImageNet.

  • Размер загрузки : 2.48 MiB

  • Размер набора данных : 19.91 GiB

  • Сплиты :

Расколоть Примеры
'train' 128 116
'validation' 50 000

Визуализация