open_images_challenge2019_detection

Open Imagesは、画像レベルのラベル、オブジェクトの境界ボックス、オブジェクトのセグメンテーションマスク、視覚的な関係で注釈が付けられた最大900万枚の画像の共同リリースです。このユニークで大きく多様なデータセットは、画像の分析と理解における最先端の進歩に拍車をかけるように設計されています。

これには、競技のオブジェクト検出トラックからのデータが含まれています。このトラックの目標は、500クラスのすべてのオブジェクトインスタンスの周囲の狭い境界ボックスを予測することです。

画像には、特定のオブジェクトクラスが存在することを示す正の画像レベルのラベルと、特定のクラスが存在しないことを示す負の画像レベルのラベルが注釈として付けられます。コンテストでは、他のすべての注釈のないクラスは、その画像の評価から除外されます。画像内のポジティブな画像レベルのラベルごとに、画像内のそのオブジェクトクラスのすべてのインスタンスに注釈が付けられました。

スプリット
'test' 99,999
'train' 1,743,042
'validation' 41,620
  • 特長
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'is_group_of': tf.bool,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'objects': Sequence({
        'confidence': tf.float32,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=500),
        'source': Text(shape=(), dtype=tf.string),
    }),
})

open_images_challenge2019_detection / 200k(デフォルト設定)

  • コンフィグの説明:画像は72 JPEGの品質で、最も20万ピクセルで持っています。

  • データセットサイズ59.40 GiB

  • tfds.show_examples ):

視覚化

open_images_challenge2019_detection / 300k

  • コンフィグの説明:画像は72 JPEGの品質で、最も30万ピクセルで持っています。

  • データセットサイズ80.44 GiB

  • tfds.show_examples ):

視覚化