Эта страница была переведа с помощью Cloud Translation API.
Switch to English

Imagenet2012

  • Описание :

ILSVRC 2012, широко известный как ImageNet, представляет собой набор данных изображений, организованный в соответствии с иерархией WordNet. Каждое значимое понятие в WordNet, которое может быть описано несколькими словами или словосочетаниями, называется «набором синонимов» или «синсетом». В WordNet более 100 000 синсетов, большинство из них - существительные (80 000+). В ImageNet мы стремимся предоставить в среднем 1000 изображений для иллюстрации каждого набора. Изображения каждой концепции проходят контроль качества и аннотируются людьми. Мы надеемся, что по завершении ImageNet предложит десятки миллионов четко отсортированных изображений для большинства концепций в иерархии WordNet.

Тестовый раздел содержит 100K изображений, но без ярлыков, потому что ярлыки не были опубликованы. Мы обеспечиваем поддержку тестового сплита с 2012 года с небольшим патчем, выпущенным 10 октября 2019 года. Чтобы вручную загрузить эти данные, пользователь должен выполнить следующие операции:

  1. Загрузите тестовый раздел 2012 года, доступный здесь .
  2. Загрузите патч от 10 октября 2019 г. На той же странице есть ссылка на Google Диск на патч.
  3. Объедините два тар-шара, вручную перезаписав любые изображения в исходном архиве изображениями из патча. Согласно инструкциям на image-net.org, эта процедура перезаписывает всего несколько изображений.

Полученный tar-шар может затем быть обработан TFDS.

Чтобы оценить точность модели на тестовом разбиении ImageNet, необходимо выполнить логический вывод для всех изображений в разбиении, экспортировать эти результаты в текстовый файл, который необходимо загрузить на оценочный сервер ImageNet. Сопровождающие оценочного сервера ImageNet разрешают одному пользователю отправлять до 2 работ в неделю во избежание переобучения.

Чтобы оценить точность тестового сплита, необходимо сначала создать учетную запись на image-net.org. Эта учетная запись должна быть одобрена администратором сайта. После создания учетной записи можно отправить результаты на тестовый сервер по адресу http://www.image-net.org/challenges/LSVRC/2013/test_server . Отправка состоит из нескольких текстовых файлов ASCII, соответствующих множеству задач. Интересующая задача - «Подача классификации (ошибка топ-5)». Пример экспортированного текстового файла выглядит следующим образом:

771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168

Формат экспорта полностью описан в файле «readme.txt» в комплекте разработчика 2013 года, доступном здесь: http://imagenet.stanford.edu/image/ilsvrc2013/ILSVRC2013_devkit.tgz См. Раздел «3.3 Формат представления CLS-LOC. ". Вкратце, формат текстового файла составляет 100 000 строк, соответствующих каждому изображению в тестовом разделе. Каждая строка целых чисел соответствует 5 верхним прогнозам в порядке ранжирования для каждого тестового изображения. Целые числа имеют индекс 1 в соответствии с номером строки в соответствующем файле меток. См. Imagenet2012_labels.txt.

  • Домашняя страница : http://image-net.org/

  • Исходный код : tfds.image_classification.Imagenet2012

  • Версии :

    • 5.1.0 (по умолчанию): без примечаний к выпуску.
    • 5.0.0 : Нет примечаний к выпуску.
  • Размер загрузки : Unknown size

  • Размер набора данных : 155.84 GiB

  • Инструкции по загрузке вручную : для этого набора данных необходимо вручную загрузить исходные данные в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir должен содержать два файла: ILSVRC2012_img_train.tar и ILSVRC2012_img_val.tar. Вам необходимо зарегистрироваться на http://www.image-net.org/download-images , чтобы получить ссылку для загрузки набора данных.

  • Автоматическое кэширование ( документация ): Нет

  • Сплит :

Трещина Примеры
'test' 100 000
'train' 1,281,167
'validation' 50 000
  • Особенности :
FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
  • Контролируемые ключи (см. as_supervised ): ('image', 'label')

  • Цитата :

@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}

Визуализация