パス

PASS は、人間、人間の一部、またはその他の個人を特定できる情報を含まない大規模な画像データセットです。プライバシーに関する懸念を大幅に軽減しながら、高品質の自己教師付き事前トレーニングに使用できます。

PASS には、YFCC-100M から提供されたラベルのない 1,439,589 枚の画像が含まれています。

このデータセット内のすべての画像は、データセット自体と同様に、CC-BY ライセンスの下でライセンスされています。 YFCC-100M については、 http: //www.multimediacommons.org/ を参照してください。

スプリット
'train' 1,439,588
  • 機能構造:
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/creator_uname': Text(shape=(), dtype=string),
    'image/date_taken': Text(shape=(), dtype=string),
    'image/gps_lat': float32,
    'image/gps_lon': float32,
    'image/hash': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
画像画像(なし、なし、3) uint8
image/creator_uname文章ストリング
画像/日付_撮影文章ストリング
画像/gps_latテンソルfloat32
画像/gps_lonテンソルfloat32
画像/ハッシュ文章ストリング

視覚化

  • 引用
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}