Wizualizacja : Eksploruj w regionie Poznaj swoje dane
opis :
dSprites to zestaw danych kształtów 2D generowanych proceduralnie z 6 ukrytych czynników niezależnych od prawdy podstawowej. Te czynniki to kolor , kształt , skala , obrót , pozycje x i y duszka.
Wszystkie możliwe kombinacje tych latentów są obecne dokładnie raz, generując łącznie N = 737280 obrazów.
Utajone wartości czynników
- Kolor biały
- Kształt: kwadrat, elipsa, serce
- Skala: 6 wartości rozmieszczonych liniowo w [0,5, 1]
- Orientacja: 40 wartości w [0, 2 pi]
- Pozycja X: 32 wartości w [0, 1]
- Pozycja Y: 32 wartości w [0, 1]
Zmienialiśmy jeden ukryty na raz (zaczynając od pozycji Y, następnie pozycji X itd.) I sekwencyjnie zapisywaliśmy obrazy w ustalonej kolejności. Stąd kolejność wzdłuż pierwszego wymiaru jest stała i pozwala na mapowanie z powrotem do wartości utajonych odpowiadających temu obrazowi.
Celowo wybraliśmy wartości utajone, aby uzyskać najmniejsze zmiany skokowe, zapewniając jednocześnie, że wszystkie wyjścia pikseli były różne. Nie dodano żadnego hałasu.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/deepmind/dsprites-dataset
Kod źródłowy :
tfds.datasets.dsprites.Builder
Wersje :
-
2.0.0
(domyślnie): Nowy podzielony interfejs API ( https://tensorflow.org/datasets/splits ) -
2.1.0
: Brak informacji o wydaniu.
-
Rozmiar pliku do pobrania :
26.73 MiB
Rozmiar zbioru danych :
Unknown size
Automatyczne buforowanie ( dokumentacja ): Nieznane
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 737280 |
- Struktura funkcji :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
obraz | Obraz | (64, 64, 1) | uint8 | |
orientacja_etykiety | Etykieta klasy | int64 | ||
skala_etykiety | Etykieta klasy | int64 | ||
kształt_etykiety | Etykieta klasy | int64 | ||
pozycja_x_etykiety | Etykieta klasy | int64 | ||
pozycja_y_etykiety | Etykieta klasy | int64 | ||
orientacja_wartości | Napinacz | pływak32 | ||
skala_wartości | Napinacz | pływak32 | ||
kształt_wartości | Napinacz | pływak32 | ||
wartość_x_pozycja | Napinacz | pływak32 | ||
wartość_y_pozycja | Napinacz | pływak32 |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
- Cytat :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}