بخش_هرچیزی

توضیحات :

SA-1B دانلود کنید

Segment Anything 1 Billion (SA-1B) مجموعه داده ای است که برای آموزش مدل های تقسیم بندی اشیاء همه منظوره از تصاویر جهان باز طراحی شده است. مجموعه داده در مقاله "Segment Anything" معرفی شد.

مجموعه داده SA-1B شامل 11 میلیون تصویر متنوع، با وضوح بالا، دارای مجوز و محافظت از حریم خصوصی و حاشیه نویسی ماسک 1.1B است. ماسک‌ها در قالب کدگذاری طول اجرا (RLE) COCO ارائه می‌شوند و کلاس ندارند.

مجوز سفارشی است. لطفا شرایط و ضوابط کامل را در https://ai.facebook.com/datasets/segment-anything-downloads بخوانید

همه ویژگی ها در مجموعه داده اصلی هستند به جز image.content (محتوای تصویر).

شما می توانید ماسک های تقسیم بندی را با موارد زیر رمزگشایی کنید:

import tensorflow_datasets as tfds

pycocotools = tfds.core.lazy_imports.pycocotools

ds = tfds.load('segment_anything', split='train')
for example in tfds.as_numpy(ds):
  segmentation = example['annotations']['segmentation']
  for counts, size in zip(segmentation['counts'], segmentation['size']):
    encoded_mask = {'size': size, 'counts': counts}
    mask = pycocotools.decode(encoded_mask)  # np.array(dtype=uint8) mask
    ...

صفحه اصلی : https://ai.facebook.com/datasets/segment-anything-downloads
کد منبع : tfds.datasets.segment_anything.Builder
نسخه ها :
- 1.0.0 (پیش فرض): انتشار اولیه.
حجم دانلود : 10.28 TiB
اندازه مجموعه داده : 10.59 TiB
دستورالعمل‌های دانلود دستی : این مجموعه داده از شما می‌خواهد که داده‌های منبع را به صورت دستی در download_config.manual_dir بارگیری کنید (پیش‌فرض به ~/tensorflow_datasets/downloads/manual/ ):
فایل پیوندها را از https://ai.facebook.com/datasets/segment-anything-downloads دانلود کنید manual_dir باید حاوی فایل پیوندهایی باشد که به عنوان segment_anything_links.txt ذخیره شده است.
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	11,185,362

ساختار ویژگی :

FeaturesDict({
    'annotations': Sequence({
        'area': Scalar(shape=(), dtype=uint64),
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'crop_box': BBoxFeature(shape=(4,), dtype=float32),
        'id': Scalar(shape=(), dtype=uint64),
        'point_coords': Tensor(shape=(1, 2), dtype=float64),
        'predicted_iou': Scalar(shape=(), dtype=float64),
        'segmentation': FeaturesDict({
            'counts': string,
            'size': Tensor(shape=(2,), dtype=uint64),
        }),
        'stability_score': Scalar(shape=(), dtype=float64),
    }),
    'image': FeaturesDict({
        'content': Image(shape=(None, None, 3), dtype=uint8),
        'file_name': string,
        'height': uint64,
        'image_id': uint64,
        'width': uint64,
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D	شرح
	FeaturesDict
حاشیه نویسی	توالی
حاشیه نویسی/منطقه	اسکالر		uint64	ناحیه بر حسب پیکسل ماسک.
حاشیه نویسی/bbox	ویژگی BBox	(4،)	float32	جعبه دور ماسک، با فرمت TFDS.
حاشیه نویسی/crop_box	ویژگی BBox	(4،)	float32	برش تصویر مورد استفاده برای تولید ماسک، در قالب TFDS.
حاشیه نویسی / شناسه	اسکالر		uint64	شناسه برای حاشیه نویسی.
حاشیه نویسی/point_coords	تانسور	(1، 2)	float64	نقطه، ورودی مدل را برای تولید ماسک مختصات می کند.
حاشیه نویسی/predicted_iou	اسکالر		float64	پیش بینی خود مدل از کیفیت ماسک.
حاشیه نویسی / بخش بندی	FeaturesDict			ماسک تقسیم بندی رمزگذاری شده در قالب COCO RLE (دیکت با `size` کلیدها و `counts` ).
حاشیه نویسی / بخش بندی / شمارش	تانسور		رشته
حاشیه نویسی / بخش بندی / اندازه	تانسور	(2،)	uint64
حاشیه نویسی/پایداری_نمره	اسکالر		float64	معیاری برای سنجش کیفیت ماسک
تصویر	FeaturesDict
تصویر/محتوا	تصویر	(هیچ، هیچ، 3)	uint8	محتوای تصویر.
تصویر/نام_فایل	تانسور		رشته
ارتفاع تصویر	تانسور		uint64
image/image_id	تانسور		uint64
عرض تصویر	تانسور		uint64

کلیدهای نظارت شده (به as_supervised doc مراجعه کنید): None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثال‌ها ( tfds.as_dataframe ): وجود ندارد.
نقل قول :

@misc{kirillov2023segment,
  title={Segment Anything},
  author={Alexander Kirillov and Eric Mintun and Nikhila Ravi and Hanzi Mao and Chloe Rolland and Laura Gustafson and Tete Xiao and Spencer Whitehead and Alexander C. Berg and Wan-Yen Lo and Piotr Dollár and Ross Girshick},
  year={2023},
  eprint={2304.02643},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}