시각화 : Know Your Data에서 탐색
설명 :
PASS는 사람, 인체 부위 또는 기타 개인 식별 정보를 포함하지 않는 대규모 이미지 데이터 세트입니다. 개인 정보 보호 문제를 크게 줄이면서 고품질 자가 감독 사전 교육에 사용할 수 있습니다.
PASS에는 YFCC-100M에서 가져온 라벨이 없는 1,439,589개의 이미지가 포함되어 있습니다.
이 데이터 세트의 모든 이미지는 데이터 세트 자체와 마찬가지로 CC-BY 라이선스에 따라 라이선스가 부여됩니다. YFCC-100M에 대해서는 http://www.multimediacommons.org/ 를 참조하십시오.
소스 코드 :
tfds.datasets.pass.Builder
버전 :
-
1.0.0
: 최초 릴리스. -
2.0.0
: v2: v1에서 사람이 포함된 472개의 이미지를 제거했습니다. 또한 메타데이터(datetaken 및 GPS)가 추가되었습니다. -
3.0.0
(기본값): v3: v2에서 사람/문신이 포함된 131개의 이미지를 제거했습니다.
-
다운로드 크기 :
167.30 GiB
데이터세트 크기 :
166.43 GiB
자동 캐시 ( 문서 ): 아니요
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,439,588 |
- 기능 구조 :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
영상 | 영상 | (없음, 없음, 3) | uint8 | |
이미지/creator_uname | 텍스트 | 끈 | ||
이미지/date_taken | 텍스트 | 끈 | ||
이미지/gps_lat | 텐서 | float32 | ||
이미지/gps_lon | 텐서 | float32 | ||
이미지/해시 | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
- 인용 :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}