Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

dsprites

dSprites to zestaw danych kształtów 2D generowanych proceduralnie z 6 niezależnych od podłoża czynników ukrytych. Czynniki te są koloru, kształtu, wagi, obrót, X i Y położenia ikonki.

Wszystkie możliwe kombinacje tych ukrytych są obecne dokładnie raz, generując łącznie N = 737280 obrazów.

Wartości czynników ukrytych

  • Kolor biały
  • Kształt: kwadrat, elipsa, serce
  • Skala: 6 wartości liniowo rozmieszczonych w [0,5, 1]
  • Orientacja: 40 wartości w [0, 2 pi]
  • Pozycja X: 32 wartości w [0, 1]
  • Pozycja Y: 32 wartości w [0, 1]

Zmienialiśmy jeden ukryty na raz (począwszy od pozycji Y, następnie pozycji X itd.) i sekwencyjnie zapisywaliśmy obrazy w ustalonej kolejności. W związku z tym kolejność wzdłuż pierwszego wymiaru jest stała i pozwala na mapowanie z powrotem do wartości latentnych odpowiadających temu obrazowi.

Celowo wybraliśmy wartości ukryte, aby mieć najmniejsze zmiany skokowe, zapewniając jednocześnie, że wszystkie wyjścia pikseli są różne. Nie dodano żadnego hałasu.

Podział Przykłady
'train' 737,280
  • Cechy:
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_x_position': tf.float32,
    'value_y_position': tf.float32,
})

Wyobrażanie sobie

  • cytat:
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}