ビジュアライゼーション: Know Your Data で探索する
説明:
PASS は、人間、人間の一部、またはその他の個人を特定できる情報を含まない大規模な画像データセットです。プライバシーに関する懸念を大幅に軽減しながら、高品質の自己教師付き事前トレーニングに使用できます。
PASS には、YFCC-100M から提供されたラベルのない 1,439,589 枚の画像が含まれています。
このデータセット内のすべての画像は、データセット自体と同様に、CC-BY ライセンスの下でライセンスされています。 YFCC-100M については、 http: //www.multimediacommons.org/ を参照してください。
追加のドキュメント:コード を使用したペーパーの探索
ソース コード:
tfds.datasets.pass.Builder
バージョン:
-
1.0.0
: 初期リリース。 -
2.0.0
: v2: 人間が含まれていたため、v1 から 472 枚の画像を削除しました。メタデータも追加: datetaken と GPS。 -
3.0.0
(デフォルト): v3: 人間/タトゥーが含まれていたため、v2 から 131 枚の画像を削除しました。
-
ダウンロードサイズ:
167.30 GiB
データセットサイズ:
166.43 GiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'train' | 1,439,588 |
- 機能構造:
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
画像 | 画像 | (なし、なし、3) | uint8 | |
image/creator_uname | 文章 | ストリング | ||
画像/日付_撮影 | 文章 | ストリング | ||
画像/gps_lat | テンソル | float32 | ||
画像/gps_lon | テンソル | float32 | ||
画像/ハッシュ | 文章 | ストリング |
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
- 引用:
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}