simetrik_solidler

  • Açıklama:

Bu, birden çok yönün görsel olarak ayırt edilemez olduğu simetrik 3B şekillerden oluşan bir poz tahmini veri kümesidir. Buradaki zorluk, eğitim sırasında her görüntüyle yalnızca bir yön eşleştirildiğinde tüm eşdeğer yönelimleri tahmin etmektir (çoğu poz tahmini veri kümesi için senaryoda olduğu gibi). Çoğu poz tahmini veri setinin aksine, değerlendirme için tam eşdeğer yönelimler seti mevcuttur.

Toplamda sekiz şekil vardır ve her biri 3B döndürmelerin tüm alanı üzerinde rastgele dağıtılmış 50.000 bakış noktasından işlenir. Şekillerin beşi özelliksizdir - tetrahedron, küp, ikosahedron, koni ve silindir. Bunlardan üç Platonik katı (tetrahedron, küp, ikosahedron) sırasıyla 12, 24 ve 60 katlı ayrı simetrileriyle açıklanmıştır. Koni ve silindir, 1 derecelik aralıklarla ayrıklaştırılmış sürekli simetrileriyle açıklamalıdır. Bu simetriler değerlendirme için sağlanmıştır; amaçlanan denetim, her görüntü ile yalnızca tek bir döndürmedir.

Kalan üç şekil, ayırt edici bir özellik ile işaretlenmiştir. Bir yüzü kırmızı renkli olan bir tetrahedron, merkezde olmayan noktalı bir silindir ve nokta ile kapatılmış X'li bir küre vardır. Ayırt edici özelliğin görünür olup olmadığı, olası yönelimlerin alanı azalır. Bu şekiller için eşdeğer döndürmeler seti sağlamıyoruz.

Her örnek şunları içerir:

  • 224x224 RGB görüntü
  • veri kümesinin şekle göre filtrelenebilmesi için bir şekil indeksi.
    Endeksler şunlara karşılık gelir:

    • 0 = tetrahedron
    • 1 = küp
    • 2 = ikosahedron
    • 3 = koni
    • 4 = silindir
    • 5 = işaretli tetrahedron
    • 6 = işaretli silindir
    • 7 = işaretli küre
  • 3x3 döndürme matrisi olarak temsil edilen, oluşturma işleminde kullanılan döndürme

  • değerlendirme için simetri altında bilinen eşdeğer dönüşler kümesi.

Üç işaretli şekil söz konusu olduğunda, bu yalnızca işleme dönüşüdür.

Bölmek Örnekler
'test' 40.000
'train' 360.000
  • Özellikler:
FeaturesDict({
    'image': Image(shape=(224, 224, 3), dtype=tf.uint8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'rotation': Tensor(shape=(3, 3), dtype=tf.float32),
    'rotations_equivalent': Tensor(shape=(None, 3, 3), dtype=tf.float32),
})

görselleştirme

  • Citation:
@inproceedings{implicitpdf2021,
  title = {Implicit Representation of Probability Distributions on the Rotation
  Manifold},
  author = {Murphy, Kieran and Esteves, Carlos and Jampani, Varun and
  Ramalingam, Srikumar and Makadia, Ameesh}
  booktitle = {International Conference on Machine Learning}
  year = {2021}
}