Визуализация : Исследуйте в Know Your Data
Описание :
dSprites — это набор данных 2D-форм, процедурно сгенерированных из 6 независимых скрытых факторов. Этими факторами являются цвет , форма , масштаб , вращение , координаты x и y спрайта.
Все возможные комбинации этих латентных изображений присутствуют ровно один раз, что дает всего N = 737280 изображений.
Скрытые значения фактора
- Белый цвет
- Форма: квадрат, эллипс, сердце
- Масштаб: 6 значений, линейно расположенных в [0,5, 1]
- Ориентация: 40 значений в [0, 2 pi]
- Позиция X: 32 значения в [0, 1]
- Позиция Y: 32 значения в [0, 1]
Мы меняли по одному скрытому за раз (начиная с позиции Y, затем позиции X и т. д.) и последовательно сохраняли изображения в фиксированном порядке. Следовательно, порядок по первому измерению фиксирован и позволяет вам сопоставить обратно значение скрытых значений, соответствующих этому изображению.
Мы намеренно выбрали латентные значения, чтобы иметь наименьшие ступенчатые изменения, гарантируя, что все выходные данные пикселей будут разными. Шум не добавлялся.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/deepmind/dsprites-dataset
Исходный код :
tfds.datasets.dsprites.Builder
Версии :
-
2.0.0
(по умолчанию): новый раздельный API ( https://tensorflow.org/datasets/splits ) -
2.1.0
: Нет примечаний к выпуску.
-
Размер загрузки :
26.73 MiB
Размер набора данных :
Unknown size
Автокэширование ( документация ): неизвестно
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 737 280 |
- Структура функции :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
изображение | Изображение | (64, 64, 1) | uint8 | |
метка_ориентация | Метка класса | int64 | ||
label_scale | Метка класса | int64 | ||
label_shape | Метка класса | int64 | ||
label_x_position | Метка класса | int64 | ||
label_y_position | Метка класса | int64 | ||
ценностная_ориентация | Тензор | поплавок32 | ||
value_scale | Тензор | поплавок32 | ||
значение_форма | Тензор | поплавок32 | ||
значение_x_позиция | Тензор | поплавок32 | ||
value_y_position | Тензор | поплавок32 |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
- Цитата :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}