पास एक बड़े पैमाने पर छवि डेटासेट है जिसमें कोई भी मानव, मानव अंग या अन्य व्यक्तिगत रूप से पहचान योग्य जानकारी शामिल नहीं है। इसका उपयोग उच्च-गुणवत्ता वाले स्व-पर्यवेक्षित पूर्व-प्रशिक्षण के लिए किया जा सकता है, जबकि गोपनीयता संबंधी चिंताओं को काफी हद तक कम कर सकता है।
PASS में YFCC-100M से लिए गए बिना किसी लेबल के 1,439,589 चित्र हैं।
इस डेटासेट की सभी छवियों को CC-BY लाइसेंस के अंतर्गत लाइसेंस दिया गया है, जैसा कि स्वयं डेटासेट है। YFCC-100M के लिए देखें http://www.multimediacommons.org/
स्रोत कोड :
tfds.datasets.pass.Builder
संस्करण :
-
1.0.0
: प्रारंभिक रिलीज। -
2.0.0
: v2: v1 से 472 चित्र निकाले गए क्योंकि उनमें मनुष्य थे। मेटाडेटा भी जोड़ा गया: डेटटेकन और जीपीएस। -
3.0.0
(डिफ़ॉल्ट): v3: v2 से 131 चित्र निकाले गए क्योंकि उनमें मानव/टैटो थे।
-
डाउनलोड का आकार :
167.30 GiB
डेटासेट का आकार :
166.43 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 1,439,588 |
- फ़ीचर संरचना :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
छवि | छवि | (कोई नहीं, कोई नहीं, 3) | uint8 | |
इमेज/क्रिएटर_यूनाम | मूलपाठ | डोरी | ||
इमेज/डेट_टेक | मूलपाठ | डोरी | ||
इमेज/gps_lat | टेन्सर | फ्लोट32 | ||
छवि/gps_lon | टेन्सर | फ्लोट32 | ||
इमेज/हैश | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ):
- उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}