ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

open_images_v4

Open Images คือชุดข้อมูลของรูปภาพ ~9M ที่ได้รับการใส่คำอธิบายประกอบด้วยป้ายกำกับระดับรูปภาพและกล่องล้อมรอบวัตถุ

ชุดการฝึกของ V4 มีกรอบล้อมรอบ 14.6 ล้านกล่องสำหรับคลาสอ็อบเจ็กต์ 600 คลาสบนอิมเมจ 1.74 ล้านรายการ ทำให้เป็นชุดข้อมูลที่มีอยู่ที่ใหญ่ที่สุดพร้อมคำอธิบายประกอบตำแหน่งอ็อบเจ็กต์ กล่องส่วนใหญ่ถูกวาดด้วยมือโดยนักบันทึกย่อมืออาชีพ เพื่อให้แน่ใจว่ามีความแม่นยำและสม่ำเสมอ รูปภาพมีความหลากหลายมากและมักประกอบด้วยฉากที่ซับซ้อนซึ่งมีวัตถุหลายอย่าง (โดยเฉลี่ย 8.4 ภาพต่อภาพ) นอกจากนี้ ชุดข้อมูลยังถูกใส่คำอธิบายประกอบด้วยป้ายกำกับระดับรูปภาพที่ครอบคลุมคลาสนับพัน

แยก ตัวอย่าง
'test' 125,436
'train' 1,743,042
'validation' 41,620
  • คุณสมบัติ:
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'is_depiction': tf.int8,
        'is_group_of': tf.int8,
        'is_inside': tf.int8,
        'is_occluded': tf.int8,
        'is_truncated': tf.int8,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=601),
        'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/filename': Text(shape=(), dtype=tf.string),
    'objects': Sequence({
        'confidence': tf.int32,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=19995),
        'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'objects_trainable': Sequence({
        'confidence': tf.int32,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=7186),
        'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
})
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

  • อ้างอิง:

@article{OpenImages,
  author = {Alina Kuznetsova and
            Hassan Rom and
            Neil Alldrin and
            Jasper Uijlings and
            Ivan Krasin and
            Jordi Pont-Tuset and
            Shahab Kamali and
            Stefan Popov and
            Matteo Malloci and
            Tom Duerig and
            Vittorio Ferrari},
  title = {The Open Images Dataset V4: Unified image classification,
           object detection, and visual relationship detection at scale},
  year = {2018},
  journal = {arXiv:1811.00982}
}
@article{OpenImages2,
  author = {Krasin, Ivan and
            Duerig, Tom and
            Alldrin, Neil and
            Ferrari, Vittorio
            and Abu-El-Haija, Sami and
            Kuznetsova, Alina and
            Rom, Hassan and
            Uijlings, Jasper and
            Popov, Stefan and
            Kamali, Shahab and
            Malloci, Matteo and
            Pont-Tuset, Jordi and
            Veit, Andreas and
            Belongie, Serge and
            Gomes, Victor and
            Gupta, Abhinav and
            Sun, Chen and
            Chechik, Gal and
            Cai, David and
            Feng, Zheyun and
            Narayanan, Dhyanesh and
            Murphy, Kevin},
  title = {OpenImages: A public dataset for large-scale multi-label and
           multi-class image classification.},
  journal = {Dataset available from
             https://storage.googleapis.com/openimages/web/index.html},
  year={2017}
}

open_images_v4/ดั้งเดิม (การกำหนดค่าเริ่มต้น)

  • คำอธิบาย Config: ภาพที่ความละเอียดเดิมของพวกเขาและคุณภาพ

  • รูป ( tfds.show_examples ):

การสร้างภาพ

open_images_v4/300k

  • Config คำอธิบาย: ภาพมีประมาณ 300,000 พิกเซลที่ 72 ที่มีคุณภาพ JPEG

  • รูป ( tfds.show_examples ):

การสร้างภาพ

open_images_v4/200k

  • Config คำอธิบาย: ภาพมีประมาณ 200,000 พิกเซลที่ 72 ที่มีคุณภาพ JPEG

  • รูป ( tfds.show_examples ):

การสร้างภาพ