open_images_challenge2019_detection

Open Images, görüntü düzeyinde etiketler, nesne sınırlayıcı kutular, nesne bölümleme maskeleri ve görsel ilişkilerle açıklamalı ~9 milyon görüntünün ortak bir sürümüdür. Bu benzersiz büyük ve çeşitli veri kümesi, görüntüleri analiz etme ve anlamada son teknoloji gelişmeleri teşvik etmek için tasarlanmıştır.

Bu, yarışmanın Nesne Algılama izinden gelen verileri içerir. Bu parçadaki amaç, 500 sınıfın tüm nesne örneklerinin etrafında sıkı bir sınırlayıcı kutu tahmin etmektir.

Görüntüler, belirli nesne sınıflarının mevcut olduğunu gösteren pozitif görüntü düzeyinde etiketlerle ve belirli sınıfların bulunmadığını belirten negatif görüntü düzeyinde etiketlerle açıklanır. Yarışmada, diğer tüm açıklamasız sınıflar o görselde değerlendirme dışı bırakılır. Bir görüntüdeki her bir pozitif görüntü düzeyi etiketi için, görüntüdeki o nesne sınıfının her bir örneğine açıklama eklendi.

Bölmek Örnekler
'test' 99,999
'train' 1.743.042
'validation' 41.620
  • Özellik yapısı :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'is_group_of': tf.bool,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'objects': Sequence({
        'confidence': tf.float32,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=500),
        'source': Text(shape=(), dtype=tf.string),
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
bobjects Sekans
bobjects/bbox BBoxÖzelliği (4,) tf.float32
bobjects/is_group_of tensör tf.bool
bobjects/etiket sınıf etiketi tf.int64
İD Metin tf.string
resim resim (Yok, Yok, 3) tf.uint8
nesneler Sekans
nesneler/güven tensör tf.float32
nesneler/etiket sınıf etiketi tf.int64
nesneler/kaynak Metin tf.string

open_images_challenge2019_detection/200k (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Görüntüler 72 JPEG kalitesinde en fazla 200.000 piksele sahiptir.

  • Veri kümesi boyutu : 59.40 GiB

open_images_challenge2019_detection/300k

  • Yapılandırma açıklaması : Görüntüler, 72 JPEG kalitesinde en fazla 300.000 piksele sahiptir.

  • Veri kümesi boyutu : 80.44 GiB