Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

проходят

PASS — это крупномасштабный набор данных изображений, который не включает людей, человеческие части или другую информацию, позволяющую установить личность. Его можно использовать для высококачественного предварительного обучения с самостоятельным наблюдением, при этом значительно снижая уровень конфиденциальности.

PASS содержит 1 439 589 изображений без каких-либо меток, полученных из YFCC-100M.

Все изображения в этом наборе данных находятся под лицензией CC-BY, как и сам набор данных. Для YFCC-100M см. http://www.multimediacommons.org/

  • Домашняя страница : https://www.robots.ox.ac.uk/~vgg/data/pass/

  • Исходный код : tfds.image.pass_dataset.PASS

  • Версии :

    • 1.0.0 : Первоначальный выпуск.
    • 2.0.0 : v2: удалено 472 изображения из v1, так как они содержали людей. Также добавлены метаданные: datetaken и GPS.
    • 3.0.0 (по умолчанию) : v3: удалено 131 изображение из v2, так как они содержали людей/татуировки.
  • Размер загрузки : Unknown size

  • Размер набора данных : Unknown size

  • Автокэширование ( документация ): неизвестно

  • Сплиты :

Расколоть Примеры
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/creator_uname': Text(shape=(), dtype=tf.string),
    'image/date_taken': Text(shape=(), dtype=tf.string),
    'image/gps_lat': tf.float32,
    'image/gps_lon': tf.float32,
    'image/hash': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Характерная черта Класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (Нет, Нет, 3) tf.uint8
image/creator_uname Текст tf.string
изображение/date_taken Текст tf.string
изображение/gps_lat Тензор tf.float32
изображение/gps_lon Тензор tf.float32
изображение/хэш Текст tf.string
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}