vượt qua

PASS là tập dữ liệu hình ảnh quy mô lớn không bao gồm bất kỳ con người, bộ phận cơ thể người hoặc thông tin nhận dạng cá nhân nào khác. Nó có thể được sử dụng để đào tạo trước tự giám sát chất lượng cao đồng thời giảm đáng kể các lo ngại về quyền riêng tư.

PASS chứa 1.439.589 hình ảnh không có bất kỳ nhãn nào có nguồn gốc từ YFCC-100M.

Tất cả hình ảnh trong tập dữ liệu này đều được cấp phép theo giấy phép CC-BY, cũng như bản thân tập dữ liệu. Đối với YFCC-100M, hãy xem http://www.multidiacommons.org/

Tách ra ví dụ
'train' 1.439.588
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/creator_uname': Text(shape=(), dtype=string),
    'image/date_taken': Text(shape=(), dtype=string),
    'image/gps_lat': float32,
    'image/gps_lon': float32,
    'image/hash': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
image/creator_uname Chữ sợi dây
ảnh/ngày_chụp Chữ sợi dây
hình ảnh/gps_lat tenxơ phao32
hình ảnh/gps_lon tenxơ phao32
hình ảnh/băm Chữ sợi dây

Hình dung

  • trích dẫn :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}