Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

dsprites

dSprites es un conjunto de datos de formas 2D generadas procedimentalmente a partir de 6 factores latentes independientes de la verdad del terreno. Estos factores son el color, la forma, escala, rotación, posiciones X e Y de un sprite.

Todas las combinaciones posibles de estos latentes están presentes exactamente una vez, generando un total de N = 737280 imágenes.

Valores de factor latente

  • Color blanco
  • Forma: cuadrado, elipse, corazón
  • Escala: 6 valores espaciados linealmente en [0,5, 1]
  • Orientación: 40 valores en [0, 2 pi]
  • Posición X: 32 valores en [0, 1]
  • Posición Y: 32 valores en [0, 1]

Variamos una latente a la vez (comenzando desde la Posición Y, luego la Posición X, etc.) y almacenamos secuencialmente las imágenes en un orden fijo. Por lo tanto, el orden a lo largo de la primera dimensión es fijo y le permite volver al valor de las latentes correspondientes a esa imagen.

Elegimos los valores latentes deliberadamente para tener los cambios de paso más pequeños al tiempo que nos aseguramos de que todas las salidas de píxeles fueran diferentes. No se añadió ningún ruido.

Separar Ejemplos de
'train' 737,280
  • características:
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_x_position': tf.float32,
    'value_y_position': tf.float32,
})

Visualización

  • Cita:
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}