उत्तीर्ण

पास एक बड़े पैमाने पर छवि डेटासेट है जिसमें कोई भी मानव, मानव अंग या अन्य व्यक्तिगत रूप से पहचान योग्य जानकारी शामिल नहीं है। इसका उपयोग उच्च-गुणवत्ता वाले स्व-पर्यवेक्षित पूर्व-प्रशिक्षण के लिए किया जा सकता है, जबकि गोपनीयता संबंधी चिंताओं को काफी हद तक कम कर सकता है।

PASS में YFCC-100M से लिए गए बिना किसी लेबल के 1,439,589 चित्र हैं।

इस डेटासेट की सभी छवियों को CC-BY लाइसेंस के अंतर्गत लाइसेंस दिया गया है, जैसा कि स्वयं डेटासेट है। YFCC-100M के लिए देखें http://www.multimediacommons.org/

विभाजित करना उदाहरण
'train' 1,439,588
  • फ़ीचर संरचना :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/creator_uname': Text(shape=(), dtype=string),
    'image/date_taken': Text(shape=(), dtype=string),
    'image/gps_lat': float32,
    'image/gps_lon': float32,
    'image/hash': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
छवि छवि (कोई नहीं, कोई नहीं, 3) uint8
इमेज/क्रिएटर_यूनाम मूलपाठ डोरी
इमेज/डेट_टेक मूलपाठ डोरी
इमेज/gps_lat टेन्सर फ्लोट32
छवि/gps_lon टेन्सर फ्लोट32
इमेज/हैश मूलपाठ डोरी

VISUALIZATION

  • उद्धरण :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}