şekiller3d

3dshapes, 6 temel gerçek bağımsız gizli faktörden prosedürel olarak oluşturulan 3B şekillerden oluşan bir veri kümesidir. Bu faktörler zemin rengi , duvar rengi , nesne rengi , ölçek , şekil ve yöndür .

Bu gizillerin tüm olası kombinasyonları tam olarak bir kez mevcuttur ve N = 480000 toplam görüntü üretir.

Gizli faktör değerleri

  • zemin tonu: [0, 1] içinde doğrusal olarak aralıklı 10 değer
  • duvar tonu: [0, 1] içinde doğrusal olarak ayrılmış 10 değer
  • nesne tonu: [0, 1] içinde doğrusal olarak aralıklı 10 değer
  • ölçek: [0, 1] içinde doğrusal olarak aralıklı 8 değer
  • şekil: [0, 1, 2, 3] içinde 4 değer
  • oryantasyon: [-30, 30] içinde doğrusal aralıklı 15 değer

Her seferinde bir gizliyi değiştirdik (yönlendirmeden başlayarak, sonra şekilden, vb.) ve görüntüleri sırayla images dizisinde sabit bir sırayla depoladık. Faktörlerin karşılık gelen değerleri, labels dizisinde aynı sırada saklanır.

Bölmek Örnekler
'train' 480.000
  • Özellikler :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=tf.uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'value_floor_hue': tf.float32,
    'value_object_hue': tf.float32,
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_wall_hue': tf.float32,
})

görselleştirme

  • alıntı :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}