RSVP для вашего местного мероприятия TensorFlow Everywhere сегодня!
Эта страница переведена с помощью Cloud Translation API.
Switch to English

imagenet2012_subset

  • Описание :

Imagenet2012Subset - это подмножество исходного набора данных ImageNet ILSVRC 2012. Набор данных использует тот же набор проверки, что и исходный набор данных ImageNet ILSVRC 2012. Однако обучающая выборка подвыборка сбалансирована по меткам. В конфигурации 1pct , 1% или 12811 изображений выбираются, большинство классов имеют одинаковое количество изображений (в среднем 12,8), некоторые классы случайным образом имеют на 1 пример больше, чем другие; а в конфигурации 10pct , ~ 10%, или 128116, большинство классов имеют одинаковое количество изображений (в среднем 128), а некоторые классы случайным образом имеют на 1 пример больше, чем другие.

Предполагается, что он будет использоваться в качестве эталона для полууправляемого обучения и первоначально использовался в документе SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Домашняя страница : http://image-net.org/

  • Исходный код : tfds.image_classification.Imagenet2012Subset

  • Версии :

    • 2.0.0 : Исправьте метки проверки.
    • 2.0.1 : Исправление кодировки. Никаких изменений с точки зрения пользователя.
    • 3.0.0 : исправлена ​​расцветка ~ 12 изображений (CMYK -> RGB). Исправить формат для согласованности (преобразовать одиночное изображение png в Jpeg). Более быстрое чтение поколения прямо из архива.

    • 4.0.0 : (не опубликовано)

    • 5.0.0 (по умолчанию): новый API разделения ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Добавлен тестовый сплит.

  • Инструкции по загрузке вручную : для этого набора данных необходимо вручную загрузить исходные данные в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir должен содержать два файла: ILSVRC2012_img_train.tar и ILSVRC2012_img_val.tar. Вам необходимо зарегистрироваться на http://www.image-net.org/download-images , чтобы получить ссылку для загрузки набора данных.

  • Автоматическое кэширование ( документация ): Нет

  • Особенности :

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
  • Контролируемые ключи (см. as_supervised ): ('image', 'label')

  • Цитата :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset / 1pct (конфигурация по умолчанию)

  • Описание конфигурации : 1% от всего обучающего набора ImageNet.

  • Размер загрузки : 254.22 KiB

  • Размер набора данных : 7.61 GiB

  • Сплит :

Трещина Примеры
'train' 12 811
'validation' 50 000

Визуализация

imagenet2012_subset / 10pct

  • Описание конфигурации : 10% всего обучающего набора ImageNet.

  • Размер загрузки : 2.48 MiB

  • Размер набора данных : 19.91 GiB

  • Сплит :

Трещина Примеры
'train' 128 116
'validation' 50 000

Визуализация