Визуализация : Исследуйте в Know Your Data
Описание :
PASS — это крупномасштабный набор данных изображений, который не включает людей, человеческие части или другую информацию, позволяющую установить личность. Его можно использовать для высококачественного предварительного обучения с самостоятельным наблюдением, при этом значительно снижая уровень конфиденциальности.
PASS содержит 1 439 589 изображений без каких-либо меток, полученных из YFCC-100M.
Все изображения в этом наборе данных находятся под лицензией CC-BY, как и сам набор данных. Для YFCC-100M см. http://www.multimediacommons.org/
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://www.robots.ox.ac.uk/~vgg/data/pass/
Исходный код :
tfds.datasets.pass.Builder
Версии :
-
1.0.0
: Первоначальный выпуск. -
2.0.0
: v2: удалено 472 изображения из v1, так как они содержали людей. Также добавлены метаданные: datetaken и GPS. -
3.0.0
(по умолчанию): v3: удалено 131 изображение из v2, так как они содержали людей/татуировки.
-
Размер загрузки :
167.30 GiB
Размер набора данных :
166.43 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1 439 588 |
- Структура функции :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
изображение | Изображение | (Нет, Нет, 3) | uint8 | |
image/creator_uname | Текст | нить | ||
изображение/date_taken | Текст | нить | ||
изображение/gps_lat | Тензор | поплавок32 | ||
изображение/gps_lon | Тензор | поплавок32 | ||
изображение/хэш | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
- Цитата :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}