open_images_challenge2019_detection

Open Images הוא מהדורה שיתופית של ~9 מיליון תמונות עם הערות בתוויות ברמת התמונה, תיבות תוחמות אובייקט, מסכות פילוח אובייקטים וקשרים ויזואליים. מערך הנתונים הגדול והמגוון הייחודי הזה נועד לעודד התקדמות מתקדמת בניתוח והבנת תמונות.

זה מכיל את הנתונים מהמסלול של זיהוי אובייקטים של התחרות. המטרה במסלול זה היא לחזות תיבה תוחמת הדוקה סביב כל מופעי האובייקט של 500 מחלקות.

התמונות מסומנות עם תוויות חיוביות ברמת תמונה, המציינות כי קיימות מחלקות אובייקטים מסוימות, ועם תוויות ברמת תמונה שליליות, המציינת כי מחלקות מסוימות נעדרות. בתחרות, כל שאר הכיתות ללא הערות אינן נכללות בהערכה בתמונה זו. עבור כל תווית חיובית ברמת תמונה בתמונה, כל מופע של אותה מחלקת אובייקט בתמונה סומן הערות.

לְפַצֵל דוגמאות
'test' 99,999
'train' 1,743,042
'validation' 41,620
  • מבנה תכונה :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
bobjects סדר פעולות
bobjects/bbox BBoxFeature (4,) לצוף32
bobjects/is_group_of מוֹתֵחַ bool
bobjects/תווית ClassLabel int64
תְעוּדַת זֶהוּת טֶקסט חוּט
תמונה תמונה (אין, אין, 3) uint8
חפצים סדר פעולות
חפצים/ביטחון מוֹתֵחַ לצוף32
חפצים/תווית ClassLabel int64
אובייקטים/מקור טֶקסט חוּט

open_images_challenge2019_detection/200k (תצורת ברירת המחדל)

  • תיאור תצורה : לתמונות יש לכל היותר 200,000 פיקסלים, באיכות 72 JPEG.

  • גודל מערך נתונים : 59.06 GiB

  • איור ( tfds.show_examples ):

רְאִיָה

open_images_challenge2019_detection/300k

  • תיאור תצורה : לתמונות יש לכל היותר 300,000 פיקסלים, באיכות 72 JPEG.

  • גודל מערך נתונים : 80.10 GiB

  • איור ( tfds.show_examples ):

רְאִיָה