Визуализация: Исследовать в Know Ваши данные
Описание:
Набор данных впервые описан в «Стэнфордский 3D объекты» раздел бумаги распутывания по подпространству диффузии . Данных состоит из 100000 визуализации каждого из объектов , кролик и Dragon из Стэнфордского 3D сканирования Repository . В будущем могут быть добавлены другие объекты, но в бумаге используются только Зайчик и Дракон. Каждый объект визуализируется с равномерно дискретизированным освещением из точки на 2-сфере и вращением в трехмерном пространстве с однородной дискретизацией. Истинные скрытые состояния представлены в виде массивов NumPy вместе с изображениями. Освещение задается как 3-вектор с единичной нормой, а вращение - как кватернион, так и ортогональная матрица 3x3.
Есть много сходства между S3O4D и существующей ML эталонных наборами данными , такими как Norb , 3D кафедры , 3D фигурой и многими другими, которые также включают в себя визуализацию множества объектов в различных позе и условиях освещения. Тем не менее, ни один из этих существующих наборов данных не включают полное многообразие вращений в 3D - большинство включает в себя только часть изменений высоты и азимут. Изображения S3O4D выбираются равномерно и независимо от всего пространства вращений и освещений, что означает, что набор данных содержит объекты, которые перевернуты и освещены сзади или снизу. Мы считаем, что это делает S3O4D однозначно подходящим для исследования генеративных моделей, в которых скрытое пространство имеет нетривиальную топологию, а также для общих методов обучения многообразию, где важна кривизна многообразия.
Домашняя страница: https://github.com/deepmind/deepmind-research/tree/master/geomancer#stanford-3d-objects-for-disentangling-s3o4d
Исходный код:
tfds.image.s3o4d.S3o4d
Версии:
-
1.0.0
( по умолчанию): Первый выпуск.
-
Скачать Размер:
911.68 MiB
Dataset Размер:
1.01 GiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'bunny_test' | 20 000 |
'bunny_train' | 80 000 |
'dragon_test' | 20 000 |
'dragon_train' | 80 000 |
- Особенности:
FeaturesDict({
'illumination': Tensor(shape=(3,), dtype=tf.float32),
'image': Image(shape=(256, 256, 3), dtype=tf.uint8),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'pose_mat': Tensor(shape=(3, 3), dtype=tf.float32),
'pose_quat': Tensor(shape=(4,), dtype=tf.float32),
})
Контролируемые ключи (см
as_supervised
документ ):None
Фигура ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
- Образец цитирования:
@article{pfau2020disentangling,
title={Disentangling by Subspace Diffusion},
author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
S{\'e}bastian},
journal={Advances in Neural Information Processing Systems (NeurIPS)},
year={2020}
}