imagenet_pi

  • Описание :

ImageNet-PI — это переработанная версия стандартного набора данных ILSVRC2012 ImageNet, в которой метки предоставляются набором из 16 глубоких нейронных сетей с различными архитектурами, предварительно обученных на стандартном ILSVRC2012. В частности, предварительно обученные модели загружаются из tf.keras.applications.

Помимо новых меток, ImageNet-PI также предоставляет метаданные о процессе аннотирования в виде степени достоверности моделей по отношению к их меткам и дополнительной информации о каждой модели.

Для получения дополнительной информации см.: ImageNet-PI

  • Домашняя страница : https://github.com/google-research-datasets/imagenet_pi/

  • Исходный код : tfds.datasets.imagenet_pi.Builder

  • Версии :

    • 1.0.0 (по умолчанию): Первый релиз.
  • Размер файла для скачивания : Unknown size

  • Размер набора данных : Unknown size

  • Инструкции по загрузке вручную : Для загрузки этого набора данных необходимо вручную загрузить исходные данные в каталог download_config.manual_dir (по умолчанию — ~/tensorflow_datasets/downloads/manual/ ):
    В каталоге manual_dir должны находиться два файла: ILSVRC2012_img_train.tar и ILSVRC2012_img_val.tar. Для получения ссылки на скачивание набора данных необходимо зарегистрироваться на сайте http://www.image-net.org/download-images .

  • Автоматическое кэширование ( документация ): Неизвестно

  • Разделение на две группы :

Расколоть Примеры
  • Структура признаков :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • Документация по функционалу :
Особенность Сорт Форма D-тип Описание
FeaturesDict
annotator_confidences Тензор (16,) float32
метки_аннотатора Тензор (16,) int64
чистая_метка Классовая метка int64
имя файла Текст нить
изображение Изображение (Нет, Нет, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}