open_images_challenge2019_detection

Open Images est une version collaborative d'environ 9 millions d'images annotées avec des étiquettes au niveau des images, des cadres de délimitation d'objets, des masques de segmentation d'objets et des relations visuelles. Cet ensemble de données particulièrement vaste et diversifié est conçu pour stimuler les avancées de pointe dans l'analyse et la compréhension des images.

Celui-ci contient les données de la piste de détection d'objets de la compétition. L'objectif de cette piste est de prédire une boîte englobante étroite autour de toutes les instances d'objets de 500 classes.

Les images sont annotées avec des étiquettes de niveau image positives, indiquant que certaines classes d'objets sont présentes, et avec des étiquettes de niveau image négatives, indiquant que certaines classes sont absentes. Dans le concours, toutes les autres classes non annotées sont exclues de l'évaluation dans cette image. Pour chaque étiquette de niveau image positive dans une image, chaque instance de cette classe d'objets dans l'image était annotée.

Diviser Exemples
'test' 99 999
'train' 1 743 042
'validation' 41 620
  • Caractéristiques:
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'is_group_of': tf.bool,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'objects': Sequence({
        'confidence': tf.float32,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=500),
        'source': Text(shape=(), dtype=tf.string),
    }),
})

open_images_challenge2019_detection/200k (configuration par défaut)

  • Description Config: Les images ont au plus 200.000 pixels, à 72 la qualité JPEG.

  • Taille Dataset: 59.40 GiB

  • Figure ( tfds.show_examples ):

Visualisation

open_images_challenge2019_detection/300k

  • Description Config: Les images ont au plus 300.000 pixels, à 72 la qualité JPEG.

  • Taille Dataset: 80.44 GiB

  • Figure ( tfds.show_examples ):

Visualisation