formes3d

3dshapes est un ensemble de données de formes 3D générées de manière procédurale à partir de 6 facteurs latents indépendants de la vérité terrain. Ces facteurs sont de couleur du sol, la couleur des murs, la couleur de l' objet, à l' échelle, la forme et l' orientation.

Toutes les combinaisons possibles de ces latents sont présentes exactement une fois, générant N = 480 000 images au total.

Valeurs des facteurs latents

  • teinte du sol : 10 valeurs espacées linéairement dans [0, 1]
  • teinte du mur : 10 valeurs espacées linéairement dans [0, 1]
  • teinte de l'objet : 10 valeurs espacées linéairement dans [0, 1]
  • échelle : 8 valeurs espacées linéairement dans [0, 1]
  • forme : 4 valeurs dans [0, 1, 2, 3]
  • orientation : 15 valeurs espacées linéairement en [-30, 30]

Nous avons fait varier une latente à la fois ( à partir de l' orientation, puis forme, etc), et stockés séquentiellement les images dans l' ordre fixé dans le images matrice. Les valeurs correspondantes des facteurs sont stockés dans le même ordre dans les labels tableau.

Diviser Exemples
'train' 480 000
  • Caractéristiques:
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=tf.uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'value_floor_hue': tf.float32,
    'value_object_hue': tf.float32,
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_wall_hue': tf.float32,
})

Visualisation

  • citation:
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}