امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

open_images_v4

  • توضیحات :

Open Images مجموعه داده ای از تصاویر 9 میلیون پوندی است که با برچسب های سطح تصویر و جعبه های محدود کردن شی یادداشت شده اند.

مجموعه آموزش V4 حاوی 14.6M جعبه محدود برای 600 کلاس شی بر روی تصاویر 1.74M است که آن را به بزرگترین مجموعه داده موجود با حاشیه نویسی مکان تبدیل می کند. جعبه ها به طور دستی توسط حاشیه نویسان حرفه ای برای اطمینان از صحت و ثبات تهیه شده اند. تصاویر بسیار متنوع هستند و اغلب حاوی صحنه های پیچیده با چندین شی (به طور متوسط ​​8.4 برای هر تصویر) هستند. علاوه بر این ، مجموعه داده با برچسب های سطح تصویر حاوی هزاران کلاس حاشیه نویسی شده است.

شکاف مثال ها
'test' 125،436
'train' 1،743،042
'validation' 41،620
  • ویژگی ها :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'is_depiction': tf.int8,
        'is_group_of': tf.int8,
        'is_inside': tf.int8,
        'is_occluded': tf.int8,
        'is_truncated': tf.int8,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=601),
        'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/filename': Text(shape=(), dtype=tf.string),
    'objects': Sequence({
        'confidence': tf.int32,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=19995),
        'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'objects_trainable': Sequence({
        'confidence': tf.int32,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=7186),
        'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): None

  • نقل قول :

@article{OpenImages,
  author = {Alina Kuznetsova and
            Hassan Rom and
            Neil Alldrin and
            Jasper Uijlings and
            Ivan Krasin and
            Jordi Pont-Tuset and
            Shahab Kamali and
            Stefan Popov and
            Matteo Malloci and
            Tom Duerig and
            Vittorio Ferrari},
  title = {The Open Images Dataset V4: Unified image classification,
           object detection, and visual relationship detection at scale},
  year = {2018},
  journal = {arXiv:1811.00982}
}
@article{OpenImages2,
  author = {Krasin, Ivan and
            Duerig, Tom and
            Alldrin, Neil and
            Ferrari, Vittorio
            and Abu-El-Haija, Sami and
            Kuznetsova, Alina and
            Rom, Hassan and
            Uijlings, Jasper and
            Popov, Stefan and
            Kamali, Shahab and
            Malloci, Matteo and
            Pont-Tuset, Jordi and
            Veit, Andreas and
            Belongie, Serge and
            Gomes, Victor and
            Gupta, Abhinav and
            Sun, Chen and
            Chechik, Gal and
            Cai, David and
            Feng, Zheyun and
            Narayanan, Dhyanesh and
            Murphy, Kevin},
  title = {OpenImages: A public dataset for large-scale multi-label and
           multi-class image classification.},
  journal = {Dataset available from
             https://storage.googleapis.com/openimages/web/index.html},
  year={2017}
}

open_images_v4 / اصلی (پیکربندی پیش فرض)

  • شرح پیکربندی : تصاویر با وضوح و کیفیت اصلی.

  • شکل ( tfds.show_examples ):

تجسم

open_images_v4 / 300k

  • توضیحات پیکربندی : تصاویر تقریباً 300000 پیکسل و با کیفیت 72 JPEG دارند.

  • شکل ( tfds.show_examples ):

تجسم

open_images_v4 / 200k

  • توضیحات پیکربندی : تصاویر تقریباً 200000 پیکسل و با کیفیت 72 JPEG دارند.

  • شکل ( tfds.show_examples ):

تجسم