Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

формы3d

3dshapes — это набор данных 3D-форм, процедурно сгенерированных из 6 независимых скрытых факторов. Этими факторами являются цвет пола, цвет стен, цвет объекта , масштаб , форма и ориентация .

Все возможные комбинации этих латентных изображений присутствуют ровно один раз, генерируя всего N = 480 000 изображений.

Скрытые значения фактора

  • оттенок пола: 10 значений, линейно расположенных в [0, 1]
  • оттенок стены: 10 значений, линейно расположенных в [0, 1]
  • оттенок объекта: 10 значений, линейно расположенных в [0, 1]
  • масштаб: 8 значений, линейно расположенных в [0, 1]
  • форма: 4 значения в [0, 1, 2, 3]
  • ориентация: 15 значений, линейно расположенных в [-30, 30]

Мы меняли по одному скрытому за раз (начиная с ориентации, затем формы и т. д.) и последовательно сохраняли изображения в фиксированном порядке в массиве images . Соответствующие значения факторов хранятся в том же порядке в массиве labels .

Расколоть Примеры
'train' 480 000
  • Особенности :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=tf.uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'value_floor_hue': tf.float32,
    'value_object_hue': tf.float32,
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_wall_hue': tf.float32,
})

Визуализация

  • Цитата :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}