¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

sólidos_simétricos

  • Descripción:

Este es un conjunto de datos de estimación de pose, que consta de formas 3D simétricas donde múltiples orientaciones son visualmente indistinguibles. El desafío es predecir todas las orientaciones equivalentes cuando solo se empareja una orientación con cada imagen durante el entrenamiento (como es el escenario para la mayoría de los conjuntos de datos de estimación de pose). A diferencia de la mayoría de los conjuntos de datos de estimación de pose, el conjunto completo de orientaciones equivalentes está disponible para evaluación.

Hay ocho formas en total, cada una renderizada desde 50.000 puntos de vista distribuidos uniformemente al azar en todo el espacio de rotaciones 3D. Cinco de las formas carecen de rasgos distintivos: tetraedro, cubo, icosaedro, cono y cilindro. De ellos, los tres sólidos platónicos (tetraedro, cubo, icosaedro) están anotados con sus simetrías discretas de 12, 24 y 60 veces, respectivamente. El cono y el cilindro están anotados con sus simetrías continuas discretizadas a intervalos de 1 grado. Estas simetrías se proporcionan para su evaluación; la supervisión prevista es solo una rotación con cada imagen.

Las tres formas restantes están marcadas con una característica distintiva. Hay un tetraedro con una cara de color rojo, un cilindro con un punto descentrado y una esfera con una X coronada por un punto. Sea o no visible el rasgo distintivo, el espacio de posibles orientaciones se reduce. No proporcionamos el conjunto de rotaciones equivalentes para estas formas.

Cada ejemplo contiene de

  • la imagen RGB 224x224
  • un índice de forma para que el conjunto de datos se pueda filtrar por forma.
    Los índices corresponden a:

    • 0 = tetraedro
    • 1 = cubo
    • 2 = icosaedro
    • 3 = cono
    • 4 = cilindro
    • 5 = tetraedro marcado
    • 6 = cilindro marcado
    • 7 = esfera marcada
  • la rotación utilizada en el proceso de renderizado, representada como una matriz de rotación de 3x3

  • el conjunto de rotaciones equivalentes conocidas bajo simetría, para evaluación.

En el caso de las tres formas marcadas, esta es solo la rotación de renderizado.

Separar Ejemplos de
'test' 40.000
'train' 360.000
  • características:
FeaturesDict({
    'image': Image(shape=(224, 224, 3), dtype=tf.uint8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'rotation': Tensor(shape=(3, 3), dtype=tf.float32),
    'rotations_equivalent': Tensor(shape=(None, 3, 3), dtype=tf.float32),
})

Visualización

  • Cita:
@inproceedings{implicitpdf2021,
  title = {Implicit Representation of Probability Distributions on the Rotation
  Manifold},
  author = {Murphy, Kieran and Esteves, Carlos and Jampani, Varun and
  Ramalingam, Srikumar and Makadia, Ameesh}
  booktitle = {International Conference on Machine Learning}
  year = {2021}
}