צורות 3d

3dshapes הוא מערך נתונים של צורות תלת-ממדיות שנוצרו באופן פרוצדורלי מ-6 גורמים סמויים בלתי תלויים של אמת קרקע. גורמים אלה הם צבע הרצפה, צבע הקיר, צבע האובייקט , קנה המידה , הצורה והכיוון .

כל השילובים האפשריים של הסמויים הללו נמצאים פעם אחת בדיוק, ומייצרים N = 480000 תמונות בסך הכל.

ערכי גורמים סמויים

  • גוון רצפה: 10 ערכים ברווח ליניארי ב-[0, 1]
  • גוון קיר: 10 ערכים ברווח ליניארי ב-[0, 1]
  • גוון אובייקט: 10 ערכים ברווח ליניארי ב-[0, 1]
  • קנה מידה: 8 ערכים ברווח ליניארי ב-[0, 1]
  • צורה: 4 ערכים ב-[0, 1, 2, 3]
  • כיוון: 15 ערכים ברווח ליניארי ב-[-30, 30]

שינינו לטנט אחד בכל פעם (החל מכיוון, אחר כך צורה וכו'), ואחסנו ברצף את התמונות בסדר קבוע במערך images . הערכים המתאימים של הגורמים מאוחסנים באותו סדר במערך labels .

לְפַצֵל דוגמאות
'train' 480,000
  • תכונות :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=tf.uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'value_floor_hue': tf.float32,
    'value_object_hue': tf.float32,
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_wall_hue': tf.float32,
})

רְאִיָה

  • ציטוט :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}