खंड_कुछ भी

  • विवरण :

एसए-1बी डाउनलोड

सेगमेंट एनीथिंग 1 बिलियन (एसए-1बी) एक डेटासेट है जिसे खुली दुनिया की छवियों से सामान्य-उद्देश्य ऑब्जेक्ट सेगमेंटेशन मॉडल के प्रशिक्षण के लिए डिज़ाइन किया गया है। डेटासेट को "सेगमेंट एनीथिंग" पेपर में पेश किया गया था।

SA-1B डेटासेट में 11M विविध, उच्च-रिज़ॉल्यूशन, लाइसेंस प्राप्त और गोपनीयता की रक्षा करने वाली छवियां और 1.1B मास्क एनोटेशन शामिल हैं। मास्क COCO रन-लेंथ एन्कोडिंग (RLE) प्रारूप में दिए गए हैं, और इनमें कक्षाएं नहीं हैं।

लाइसेंस कस्टम है. कृपया, https://ai.facebook.com/datasets/segment-anything-downloads पर पूर्ण नियम और शर्तें पढ़ें

image.content (छवि की सामग्री) को छोड़कर सभी सुविधाएँ मूल डेटासेट में हैं।

आप सेगमेंटेशन मास्क को डीकोड कर सकते हैं:

import tensorflow_datasets as tfds

pycocotools = tfds.core.lazy_imports.pycocotools

ds = tfds.load('segment_anything', split='train')
for example in tfds.as_numpy(ds):
  segmentation = example['annotations']['segmentation']
  for counts, size in zip(segmentation['counts'], segmentation['size']):
    encoded_mask = {'size': size, 'counts': counts}
    mask = pycocotools.decode(encoded_mask)  # np.array(dtype=uint8) mask
    ...
  • मुखपृष्ठ : https://ai.facebook.com/datasets/segment-anything-downloads

  • स्रोत कोड : tfds.datasets.segment_anything.Builder

  • संस्करण :

    • 1.0.0 (डिफ़ॉल्ट): प्रारंभिक रिलीज़।
  • डाउनलोड आकार : 10.28 TiB

  • डेटासेट का आकार : 10.59 TiB

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    लिंक फ़ाइल को https://ai.facebook.com/datasets/segment-anything-downloads से डाउनलोड manual_dir

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 11,185,362
  • फ़ीचर संरचना :
FeaturesDict({
    'annotations': Sequence({
        'area': Scalar(shape=(), dtype=uint64),
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'crop_box': BBoxFeature(shape=(4,), dtype=float32),
        'id': Scalar(shape=(), dtype=uint64),
        'point_coords': Tensor(shape=(1, 2), dtype=float64),
        'predicted_iou': Scalar(shape=(), dtype=float64),
        'segmentation': FeaturesDict({
            'counts': string,
            'size': Tensor(shape=(2,), dtype=uint64),
        }),
        'stability_score': Scalar(shape=(), dtype=float64),
    }),
    'image': FeaturesDict({
        'content': Image(shape=(None, None, 3), dtype=uint8),
        'file_name': string,
        'height': uint64,
        'image_id': uint64,
        'width': uint64,
    }),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
एनोटेशन अनुक्रम
टिप्पणियाँ/क्षेत्र अदिश uint64 मास्क के पिक्सेल में क्षेत्र.
एनोटेशन/बीबॉक्स बीबॉक्सफ़ीचर (4,) फ्लोट32 मास्क के चारों ओर का बॉक्स, टीएफडीएस प्रारूप में।
एनोटेशन/क्रॉप_बॉक्स बीबॉक्सफ़ीचर (4,) फ्लोट32 टीएफडीएस प्रारूप में, मास्क बनाने के लिए छवि की क्रॉप का उपयोग किया गया।
एनोटेशन/आईडी अदिश uint64 एनोटेशन के लिए पहचानकर्ता.
टिप्पणियाँ/point_coords टेन्सर (1,2) फ्लोट64 यह बिंदु मास्क उत्पन्न करने के लिए मॉडल में इनपुट का समन्वय करता है।
एनोटेशन/predicted_iou अदिश फ्लोट64 मास्क की गुणवत्ता के बारे में मॉडल की अपनी भविष्यवाणी।
एनोटेशन/विभाजन फीचर्सडिक्ट COCO RLE प्रारूप में एन्कोडेड सेगमेंटेशन मास्क (कुंजी size और counts के साथ निर्देश)।
टिप्पणियाँ/विभाजन/गिनती टेन्सर डोरी
एनोटेशन/विभाजन/आकार टेन्सर (2,) uint64
एनोटेशन/स्थिरता_स्कोर अदिश फ्लोट64 मास्क की गुणवत्ता का एक माप.
छवि फीचर्सडिक्ट
छवि/सामग्री छवि (कोई नहीं, कोई नहीं, 3) uint8 छवि की सामग्री.
छवि/फ़ाइल_नाम टेन्सर डोरी
चित्र की ऊंचाई टेन्सर uint64
छवि/image_id टेन्सर uint64
इमेज की चौड़ाई टेन्सर uint64
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उदाहरण ( tfds.as_dataframe ): गुम है।

  • उद्धरण :

@misc{kirillov2023segment,
  title={Segment Anything},
  author={Alexander Kirillov and Eric Mintun and Nikhila Ravi and Hanzi Mao and Chloe Rolland and Laura Gustafson and Tete Xiao and Spencer Whitehead and Alexander C. Berg and Wan-Yen Lo and Piotr Dollár and Ross Girshick},
  year={2023},
  eprint={2304.02643},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}