open_images_challenge2019_detection

Gambar Terbuka adalah rilis kolaboratif dari ~9 juta gambar yang dianotasi dengan label tingkat gambar, kotak pembatas objek, masker segmentasi objek, dan hubungan visual. Kumpulan data unik yang besar dan beragam ini dirancang untuk memacu kemajuan canggih dalam menganalisis dan memahami gambar.

Ini berisi data dari trek Deteksi Objek kompetisi. Sasaran dalam trek ini adalah untuk memprediksi kotak pembatas yang ketat di sekitar semua instance objek dari 500 kelas.

Gambar dianotasi dengan label level gambar positif, menunjukkan kelas objek tertentu ada, dan dengan label level gambar negatif, menunjukkan kelas tertentu tidak ada. Dalam kompetisi, semua kelas lain yang tidak diberi anotasi dikecualikan dari evaluasi pada gambar tersebut. Untuk setiap label level gambar positif dalam sebuah gambar, setiap instance dari kelas objek dalam gambar tersebut dianotasi.

Membelah Contoh
'test' 99.999
'train' 1.743.042
'validation' 41.620
  • Struktur fitur :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
bobjects Urutan
bobjects/bbox Fitur BBox (4,) float32
bobjects/is_group_of Tensor bool
bobjects/label LabelKelas int64
Indo Teks rangkaian
gambar Gambar (Tidak ada, Tidak ada, 3) uint8
objek Urutan
benda/kepercayaan Tensor float32
benda/label LabelKelas int64
benda/sumber Teks rangkaian

open_images_challenge2019_detection/200k (konfigurasi default)

  • Deskripsi konfigurasi : Gambar memiliki maksimal 200.000 piksel, dengan kualitas 72 JPEG.

  • Ukuran dataset : 59.06 GiB

  • Gambar ( tfds.show_examples ):

Visualisasi

open_images_challenge2019_detection/300k

  • Deskripsi konfigurasi : Gambar memiliki maksimal 300.000 piksel, dengan kualitas 72 JPEG.

  • Ukuran dataset : 80.10 GiB

  • Gambar ( tfds.show_examples ):

Visualisasi