Wizualizacja : Eksploruj w regionie Poznaj swoje dane
opis :
3dshapes to zestaw danych kształtów 3D generowanych proceduralnie z 6 ukrytych czynników niezależnych od prawdy podstawowej. Czynniki te to kolor podłogi, kolor ścian, kolor obiektu , skala , kształt i orientacja .
Wszystkie możliwe kombinacje tych latentów występują dokładnie raz, generując łącznie N = 480000 obrazów.
Utajone wartości czynników
- odcień podłogi: 10 wartości rozmieszczonych liniowo w [0, 1]
- odcień ściany: 10 wartości rozmieszczonych liniowo w [0, 1]
- odcień obiektu: 10 wartości rozmieszczonych liniowo w [0, 1]
- skala: 8 wartości rozmieszczonych liniowo w [0, 1]
- kształt: 4 wartości w [0, 1, 2, 3]
- orientacja: 15 wartości rozmieszczonych liniowo w [-30, 30]
Zmienialiśmy jeden ukryty na raz (zaczynając od orientacji, następnie kształtu itp.) I sekwencyjnie zapisywaliśmy obrazy w ustalonej kolejności w tablicy images
. Odpowiednie wartości czynników są przechowywane w tej samej kolejności w tablicy labels
.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/deepmind/3d-shapes
Kod źródłowy :
tfds.datasets.shapes3d.Builder
Wersje :
-
2.0.0
(domyślnie): Nowy podzielony interfejs API ( https://tensorflow.org/datasets/splits )
-
Rozmiar pliku do pobrania :
255.18 MiB
Rozmiar zestawu danych :
1.68 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 480 000 |
- Struktura funkcji :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
obraz | Obraz | (64, 64, 3) | uint8 | |
label_floor_hue | Etykieta klasy | int64 | ||
label_obiekt_odcień | Etykieta klasy | int64 | ||
orientacja_etykiety | Etykieta klasy | int64 | ||
skala_etykiety | Etykieta klasy | int64 | ||
kształt_etykiety | Etykieta klasy | int64 | ||
label_wall_hue | Etykieta klasy | int64 | ||
wartość_odcień_podłogi | Napinacz | pływak32 | ||
wartość_obiektu_odcień | Napinacz | pływak32 | ||
orientacja_wartości | Napinacz | pływak32 | ||
skala_wartości | Napinacz | pływak32 | ||
kształt_wartości | Napinacz | pływak32 | ||
wartość_ściany_odcień | Napinacz | pływak32 |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
- Cytat :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}