kształty3d

3dshapes to zestaw danych kształtów 3D generowanych proceduralnie z 6 ukrytych czynników niezależnych od prawdy podstawowej. Czynniki te to kolor podłogi, kolor ścian, kolor obiektu , skala , kształt i orientacja .

Wszystkie możliwe kombinacje tych latentów występują dokładnie raz, generując łącznie N = 480000 obrazów.

Utajone wartości czynników

  • odcień podłogi: 10 wartości rozmieszczonych liniowo w [0, 1]
  • odcień ściany: 10 wartości rozmieszczonych liniowo w [0, 1]
  • odcień obiektu: 10 wartości rozmieszczonych liniowo w [0, 1]
  • skala: 8 wartości rozmieszczonych liniowo w [0, 1]
  • kształt: 4 wartości w [0, 1, 2, 3]
  • orientacja: 15 wartości rozmieszczonych liniowo w [-30, 30]

Zmienialiśmy jeden ukryty na raz (zaczynając od orientacji, następnie kształtu itp.) I sekwencyjnie zapisywaliśmy obrazy w ustalonej kolejności w tablicy images . Odpowiednie wartości czynników są przechowywane w tej samej kolejności w tablicy labels .

Rozdzielać Przykłady
'train' 480 000
  • Struktura funkcji :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
obraz Obraz (64, 64, 3) uint8
label_floor_hue Etykieta klasy int64
label_obiekt_odcień Etykieta klasy int64
orientacja_etykiety Etykieta klasy int64
skala_etykiety Etykieta klasy int64
kształt_etykiety Etykieta klasy int64
label_wall_hue Etykieta klasy int64
wartość_odcień_podłogi Napinacz pływak32
wartość_obiektu_odcień Napinacz pływak32
orientacja_wartości Napinacz pływak32
skala_wartości Napinacz pływak32
kształt_wartości Napinacz pływak32
wartość_ściany_odcień Napinacz pływak32

Wyobrażanie sobie

  • Cytat :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}