symetrique_solides

  • Description:

Il s'agit d'un ensemble de données d'estimation de pose, composé de formes 3D symétriques où plusieurs orientations sont visuellement indiscernables. Le défi consiste à prédire toutes les orientations équivalentes lorsqu'une seule orientation est associée à chaque image pendant la formation (comme c'est le cas pour la plupart des ensembles de données d'estimation de pose). Contrairement à la plupart des ensembles de données d'estimation de pose, l'ensemble complet d'orientations équivalentes est disponible pour évaluation.

Il y a huit formes au total, chacune rendue à partir de 50 000 points de vue répartis uniformément au hasard sur tout l'espace des rotations 3D. Cinq des formes sont sans caractéristiques - tétraèdre, cube, icosaèdre, cône et cylindre. Parmi ceux-ci, les trois solides platoniciens (tétraèdre, cube, icosaèdre) sont annotés avec leurs symétries discrètes de 12, 24 et 60 fois, respectivement. Le cône et le cylindre sont annotés avec leurs symétries continues discrétisées à des intervalles de 1 degré. Ces symétries sont fournies à des fins d'évaluation ; la supervision prévue n'est qu'une seule rotation avec chaque image.

Les trois formes restantes sont marquées d'un trait distinctif. Il y a un tétraèdre avec une face de couleur rouge, un cylindre avec un point décentré et une sphère avec un X coiffé d'un point. Que le signe distinctif soit visible ou non, l'espace des orientations possibles est réduit. Nous ne fournissons pas l'ensemble des rotations équivalentes pour ces formes.

Chaque exemple contient

  • l'image RVB 224x224
  • un index de forme afin que l'ensemble de données puisse être filtré par forme.
    Les indices correspondent à :

    • 0 = tétraèdre
    • 1 = cube
    • 2 = icosaèdre
    • 3 = cône
    • 4 = cylindre
    • 5 = tétraèdre marqué
    • 6 = cylindre marqué
    • 7 = sphère marquée
  • la rotation utilisée dans le processus de rendu, représentée sous la forme d'une matrice de rotation 3x3

  • l'ensemble des rotations équivalentes connues sous symétrie, pour évaluation.

Dans le cas des trois formes marquées, il ne s'agit que de la rotation de rendu.

Diviser Exemples
'test' 40 000
'train' 360 000
  • Caractéristiques:
FeaturesDict({
    'image': Image(shape=(224, 224, 3), dtype=tf.uint8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'rotation': Tensor(shape=(3, 3), dtype=tf.float32),
    'rotations_equivalent': Tensor(shape=(None, 3, 3), dtype=tf.float32),
})

Visualisation

  • citation:
@inproceedings{implicitpdf2021,
  title = {Implicit Representation of Probability Distributions on the Rotation
  Manifold},
  author = {Murphy, Kieran and Esteves, Carlos and Jampani, Varun and
  Ramalingam, Srikumar and Makadia, Ameesh}
  booktitle = {International Conference on Machine Learning}
  year = {2021}
}