vượt qua

Sự miêu tả :

PASS là tập dữ liệu hình ảnh quy mô lớn không bao gồm bất kỳ con người, bộ phận cơ thể người hoặc thông tin nhận dạng cá nhân nào khác. Nó có thể được sử dụng để đào tạo trước tự giám sát chất lượng cao đồng thời giảm đáng kể những lo ngại về quyền riêng tư.

PASS chứa 1.439.589 hình ảnh không có nhãn có nguồn gốc từ YFCC-100M.

Tất cả hình ảnh trong tập dữ liệu này đều được cấp phép theo giấy phép CC-BY, cũng như chính tập dữ liệu đó. Đối với YFCC-100M, hãy xem http://www.multimediacommons.org/

Tài liệu bổ sung : Khám phá trên giấy tờ có mã
Trang chủ : https://www.robots.ox.ac.uk/~vgg/data/pass/
Mã nguồn : tfds.datasets.pass.Builder
Phiên bản :
- 1.0.0 : Bản phát hành đầu tiên.
- 2.0.0 : v2: Đã xóa 472 hình ảnh khỏi v1 vì chúng chứa con người. Cũng đã thêm siêu dữ liệu: ngày tháng và GPS.
- 3.0.0 (mặc định): v3: Đã xóa 131 hình ảnh khỏi v2 vì chúng chứa con người/hình xăm.
Kích thước tải xuống : 167.30 GiB
Kích thước tập dữ liệu : 166.43 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :

Tách ra	Ví dụ
`'train'`	1.439.588

Cấu trúc tính năng :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/creator_uname': Text(shape=(), dtype=string),
    'image/date_taken': Text(shape=(), dtype=string),
    'image/gps_lat': float32,
    'image/gps_lon': float32,
    'image/hash': Text(shape=(), dtype=string),
})

Tài liệu tính năng :

Tính năng	Lớp học	Hình dạng	loại D
	Tính năngDict
hình ảnh	Hình ảnh	(Không, Không, 3)	uint8
hình ảnh/người sáng tạo_uname	Chữ		sợi dây
hình ảnh/ngày_taken	Chữ		sợi dây
hình ảnh/gps_lat	Tenxơ		phao32
hình ảnh/gps_lon	Tenxơ		phao32
hình ảnh/băm	Chữ		sợi dây

Khóa được giám sát (Xem as_supervised doc ): None
Hình ( tfds.show_examples ):

Hình dung

Ví dụ ( tfds.as_dataframe ):

Trích dẫn :

@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}