بخش_هرچیزی

  • توضیحات :

SA-1B دانلود کنید

Segment Anything 1 Billion (SA-1B) مجموعه داده ای است که برای آموزش مدل های تقسیم بندی اشیاء همه منظوره از تصاویر جهان باز طراحی شده است. مجموعه داده در مقاله "Segment Anything" معرفی شد.

مجموعه داده SA-1B شامل 11 میلیون تصویر متنوع، با وضوح بالا، دارای مجوز و محافظت از حریم خصوصی و حاشیه نویسی ماسک 1.1B است. ماسک‌ها در قالب کدگذاری طول اجرا (RLE) COCO ارائه می‌شوند و کلاس ندارند.

مجوز سفارشی است. لطفا شرایط و ضوابط کامل را در https://ai.facebook.com/datasets/segment-anything-downloads بخوانید

همه ویژگی ها در مجموعه داده اصلی هستند به جز image.content (محتوای تصویر).

شما می توانید ماسک های تقسیم بندی را با موارد زیر رمزگشایی کنید:

import tensorflow_datasets as tfds

pycocotools = tfds.core.lazy_imports.pycocotools

ds = tfds.load('segment_anything', split='train')
for example in tfds.as_numpy(ds):
  segmentation = example['annotations']['segmentation']
  for counts, size in zip(segmentation['counts'], segmentation['size']):
    encoded_mask = {'size': size, 'counts': counts}
    mask = pycocotools.decode(encoded_mask)  # np.array(dtype=uint8) mask
    ...
  • صفحه اصلی : https://ai.facebook.com/datasets/segment-anything-downloads

  • کد منبع : tfds.datasets.segment_anything.Builder

  • نسخه ها :

    • 1.0.0 (پیش فرض): انتشار اولیه.
  • حجم دانلود : 10.28 TiB

  • اندازه مجموعه داده : 10.59 TiB

  • دستورالعمل‌های دانلود دستی : این مجموعه داده از شما می‌خواهد که داده‌های منبع را به صورت دستی در download_config.manual_dir بارگیری کنید (پیش‌فرض به ~/tensorflow_datasets/downloads/manual/ ):
    فایل پیوندها را از https://ai.facebook.com/datasets/segment-anything-downloads دانلود کنید manual_dir باید حاوی فایل پیوندهایی باشد که به عنوان segment_anything_links.txt ذخیره شده است.

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 11,185,362
  • ساختار ویژگی :
FeaturesDict({
    'annotations': Sequence({
        'area': Scalar(shape=(), dtype=uint64),
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'crop_box': BBoxFeature(shape=(4,), dtype=float32),
        'id': Scalar(shape=(), dtype=uint64),
        'point_coords': Tensor(shape=(1, 2), dtype=float64),
        'predicted_iou': Scalar(shape=(), dtype=float64),
        'segmentation': FeaturesDict({
            'counts': string,
            'size': Tensor(shape=(2,), dtype=uint64),
        }),
        'stability_score': Scalar(shape=(), dtype=float64),
    }),
    'image': FeaturesDict({
        'content': Image(shape=(None, None, 3), dtype=uint8),
        'file_name': string,
        'height': uint64,
        'image_id': uint64,
        'width': uint64,
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
حاشیه نویسی توالی
حاشیه نویسی/منطقه اسکالر uint64 ناحیه بر حسب پیکسل ماسک.
حاشیه نویسی/bbox ویژگی BBox (4،) float32 جعبه دور ماسک، با فرمت TFDS.
حاشیه نویسی/crop_box ویژگی BBox (4،) float32 برش تصویر مورد استفاده برای تولید ماسک، در قالب TFDS.
حاشیه نویسی / شناسه اسکالر uint64 شناسه برای حاشیه نویسی.
حاشیه نویسی/point_coords تانسور (1، 2) float64 نقطه، ورودی مدل را برای تولید ماسک مختصات می کند.
حاشیه نویسی/predicted_iou اسکالر float64 پیش بینی خود مدل از کیفیت ماسک.
حاشیه نویسی / بخش بندی FeaturesDict ماسک تقسیم بندی رمزگذاری شده در قالب COCO RLE (دیکت با size کلیدها و counts ).
حاشیه نویسی / بخش بندی / شمارش تانسور رشته
حاشیه نویسی / بخش بندی / اندازه تانسور (2،) uint64
حاشیه نویسی/پایداری_نمره اسکالر float64 معیاری برای سنجش کیفیت ماسک
تصویر FeaturesDict
تصویر/محتوا تصویر (هیچ، هیچ، 3) uint8 محتوای تصویر.
تصویر/نام_فایل تانسور رشته
ارتفاع تصویر تانسور uint64
image/image_id تانسور uint64
عرض تصویر تانسور uint64
@misc{kirillov2023segment,
  title={Segment Anything},
  author={Alexander Kirillov and Eric Mintun and Nikhila Ravi and Hanzi Mao and Chloe Rolland and Laura Gustafson and Tete Xiao and Spencer Whitehead and Alexander C. Berg and Wan-Yen Lo and Piotr Dollár and Ross Girshick},
  year={2023},
  eprint={2304.02643},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}