formes3d

3dshapes est un ensemble de données de formes 3D générées de manière procédurale à partir de 6 facteurs latents indépendants de la vérité terrain. Ces facteurs sont la couleur du sol, la couleur des murs, la couleur de l' objet , l' échelle , la forme et l'orientation .

Toutes les combinaisons possibles de ces latentes sont présentes exactement une fois, générant N = 480 000 images au total.

Valeurs des facteurs latents

  • teinte du sol : 10 valeurs espacées linéairement dans [0, 1]
  • teinte du mur : 10 valeurs espacées linéairement dans [0, 1]
  • teinte de l'objet : 10 valeurs espacées linéairement dans [0, 1]
  • échelle : 8 valeurs linéairement espacées en [0, 1]
  • forme : 4 valeurs dans [0, 1, 2, 3]
  • orientation : 15 valeurs linéairement espacées en [-30, 30]

Nous avons fait varier une latente à la fois (en partant de l'orientation, puis de la forme, etc.) et avons stocké séquentiellement les images dans un ordre fixe dans le tableau d' images . Les valeurs correspondantes des facteurs sont stockées dans le même ordre dans le tableau des labels .

Diviser Exemples
'train' 480 000
  • Structure des fonctionnalités :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
image Image (64, 64, 3) uint8
label_floor_hue Étiquette de classe int64
label_object_hue Étiquette de classe int64
label_orientation Étiquette de classe int64
label_scale Étiquette de classe int64
label_shape Étiquette de classe int64
label_wall_hue Étiquette de classe int64
value_floor_hue Tenseur float32
value_object_hue Tenseur float32
orientation_valeur Tenseur float32
value_scale Tenseur float32
value_shape Tenseur float32
value_wall_hue Tenseur float32

Visualisation

  • Citation :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}