open_images_challenge2019_detection

Open Images הוא מהדורה משותפת של ~9 מיליון תמונות עם הערות עם תוויות ברמת התמונה, תיבות תוחמות אובייקט, מסכות פילוח אובייקטים וקשרים ויזואליים. מערך הנתונים הגדול והמגוון הייחודי הזה נועד לעודד התקדמות מתקדמת בניתוח והבנת תמונות.

זה מכיל את הנתונים מהמסלול של זיהוי אובייקטים של התחרות. המטרה במסלול זה היא לחזות תיבה תוחמת הדוקה סביב כל מופעי האובייקט של 500 מחלקות.

התמונות מסומנות עם תוויות חיוביות ברמת התמונה, המציינות כי קיימות מחלקות אובייקטים מסוימות, ועם תוויות ברמת תמונה שליליות, המציינת כי מחלקות מסוימות נעדרות. בתחרות, כל שאר הכיתות ללא הערות אינן נכללות בהערכה בתמונה זו. עבור כל תווית חיובית ברמת תמונה בתמונה, כל מופע של אותה מחלקת אובייקט בתמונה סומן הערות.

לְפַצֵל דוגמאות
'test' 99,999
'train' 1,743,042
'validation' 41,620
  • מבנה תכונה :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'is_group_of': tf.bool,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'objects': Sequence({
        'confidence': tf.float32,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=500),
        'source': Text(shape=(), dtype=tf.string),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
bobjects סדר פעולות
bobjects/bbox BBoxFeature (4,) tf.float32
bobjects/is_group_of מוֹתֵחַ tf.bool
bobjects/תווית ClassLabel tf.int64
תְעוּדַת זֶהוּת טֶקסט tf.string
תמונה תמונה (אין, אין, 3) tf.uint8
חפצים סדר פעולות
חפצים/ביטחון מוֹתֵחַ tf.float32
חפצים/תווית ClassLabel tf.int64
אובייקטים/מקור טֶקסט tf.string

open_images_challenge2019_detection/200k (תצורת ברירת מחדל)

  • תיאור תצורה : לתמונות יש לכל היותר 200,000 פיקסלים, באיכות 72 JPEG.

  • גודל מערך נתונים : 59.40 GiB

open_images_challenge2019_detection/300k

  • תיאור תצורה : לתמונות יש לכל היותר 300,000 פיקסלים, באיכות 72 JPEG.

  • גודל מערך נתונים : 80.44 GiB