عبور

PASS یک مجموعه داده تصویری در مقیاس بزرگ است که شامل هیچ انسان، بخش‌های انسانی یا سایر اطلاعات قابل شناسایی شخصی نمی‌شود. می‌توان از آن برای پیش‌آموزش‌های باکیفیت با نظارت خود استفاده کرد و در عین حال نگرانی‌های مربوط به حریم خصوصی را به‌طور چشمگیری کاهش داد.

PASS شامل 1439589 تصویر بدون هیچ برچسبی است که از YFCC-100M تهیه شده است.

تمامی تصاویر موجود در این مجموعه داده تحت مجوز CC-BY و همچنین خود مجموعه داده دارای مجوز هستند. برای YFCC-100M به http://www.multimediacommons.org/ مراجعه کنید

  • اسناد اضافی : کاوش در کاغذها با کد

  • صفحه اصلی : https://www.robots.ox.ac.uk/~vgg/data/pass/

  • کد منبع : tfds.datasets.pass.Builder

  • نسخه ها :

    • 1.0.0 : انتشار اولیه.
    • 2.0.0 : v2: 472 تصویر از نسخه 1 حذف شد زیرا حاوی انسان بود. همچنین متادیتا اضافه شده است: datetaken و GPS.
    • 3.0.0 (پیش‌فرض): v3: 131 تصویر از نسخه 2 حذف شد زیرا حاوی انسان/خالکوبی بودند.
  • حجم دانلود : 167.30 GiB

  • حجم مجموعه داده : 166.43 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 1,439,588
  • ساختار ویژگی :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/creator_uname': Text(shape=(), dtype=string),
    'image/date_taken': Text(shape=(), dtype=string),
    'image/gps_lat': float32,
    'image/gps_lon': float32,
    'image/hash': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تصویر تصویر (هیچ، هیچ، 3) uint8
image/creator_uname متن رشته
تصویر/تاریخ_گرفته شده متن رشته
image/gps_lat تانسور float32
image/gps_lon تانسور float32
تصویر/هش متن رشته

تجسم

  • نقل قول :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}