نجاح

PASS عبارة عن مجموعة بيانات صور كبيرة الحجم لا تتضمن أي بشر أو أجزاء بشرية أو أي معلومات تعريف شخصية أخرى. يمكن استخدامه لإجراء تدريب مسبق عالي الجودة تحت الإشراف الذاتي مع تقليل مخاوف الخصوصية بشكل كبير.

يحتوي PASS على 1439589 صورة بدون أي ملصقات مصدرها YFCC-100M.

جميع الصور الموجودة في مجموعة البيانات هذه مرخصة بموجب ترخيص CC-BY ، كما هو الحال مع مجموعة البيانات نفسها. للاطلاع على YFCC-100M ، راجع http://www.multimediacommons.org/

  • وثائق إضافية : استكشف في الأوراق باستخدام الرمز

  • الصفحة الرئيسية : https://www.robots.ox.ac.uk/~vgg/data/pass/

  • كود المصدر : tfds.datasets.pass.Builder

  • إصدارات :

    • 1.0.0 : الإصدار الأولي.
    • 2.0.0 : v2: تمت إزالة 472 صورة من الإصدار 1 لأنها تحتوي على بشر. تمت أيضًا إضافة البيانات الوصفية: أخذ البيانات و GPS.
    • 3.0.0 (افتراضي): v3: تمت إزالة 131 صورة من الإصدار 2 لأنها تحتوي على بشر / تاتو.
  • حجم التحميل : 167.30 GiB

  • حجم مجموعة البيانات : 166.43 GiB

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • الانقسامات :

انشق، مزق أمثلة
'train' 1،439،588
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/creator_uname': Text(shape=(), dtype=string),
    'image/date_taken': Text(shape=(), dtype=string),
    'image/gps_lat': float32,
    'image/gps_lon': float32,
    'image/hash': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صورة صورة (لا شيء ، لا شيء ، 3) uint8
الصورة / creator_uname نص سلسلة
الصورة / date_taken نص سلسلة
صورة / gps_lat موتر تعويم 32
صورة / gps_lon موتر تعويم 32
الصورة / التجزئة نص سلسلة

التصور

  • الاقتباس :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}