RSVP для вашего местного мероприятия TensorFlow Everywhere сегодня!
Эта страница переведена с помощью Cloud Translation API.
Switch to English

s3o4d

  • Описание :

Набор данных впервые описан в разделе «Стэнфордские трехмерные объекты» статьи « Распутывание путём подпространственной диффузии» . Данные состоят из 100 000 визуализаций каждого из объектов Bunny и Dragon из Стэнфордского хранилища 3D-сканирования . В будущем могут быть добавлены другие объекты, но в бумаге используются только Зайчик и Дракон. Каждый объект визуализируется с равномерно дискретизированным освещением из точки на 2-сфере и вращением однородно дискретизированного 3D. Истинные скрытые состояния представлены в виде массивов NumPy вместе с изображениями. Освещение задается как 3-вектор с единичной нормой, в то время как вращение предоставляется как кватернион, так и ортогональная матрица 3x3.

Есть много общего между S3O4D и существующими наборами данных тестов машинного обучения , такими как NORB , 3D Chairs , 3D Shapes и многими другими, которые также включают визуализацию набора объектов в разных позах и условиях освещения. Однако ни один из этих существующих наборов данных не включает полное множество вращений в 3D - большинство включает только часть изменений высоты и азимута. Изображения S3O4D выбираются равномерно и независимо от всего пространства вращения и освещения, что означает, что набор данных содержит объекты, которые перевернуты и освещены сзади или снизу. Мы считаем, что это делает S3O4D однозначно подходящим для исследования генеративных моделей, где скрытое пространство имеет нетривиальную топологию, а также для общих методов обучения многообразию, где важна кривизна многообразия.

Трещина Примеры
'bunny_test' 20 000
'bunny_train' 80 000
'dragon_test' 20 000
'dragon_train' 80 000
  • Особенности :
FeaturesDict({
    'illumination': Tensor(shape=(3,), dtype=tf.float32),
    'image': Image(shape=(256, 256, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'pose_mat': Tensor(shape=(3, 3), dtype=tf.float32),
    'pose_quat': Tensor(shape=(4,), dtype=tf.float32),
})
  • Контролируемые ключи (см. as_supervised doc ): None

  • Цитата :

@article{pfau2020disentangling,
  title={Disentangling by Subspace Diffusion},
  author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
  S{\'e}bastian},
  journal={Advances in Neural Information Processing Systems (NeurIPS)},
  year={2020}
}

Визуализация