Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

s3o4d

Zestaw danych po raz pierwszy opisane w „Stanford 3D obiektów” odcinek papieru rozczesywania przez podprzestrzeni dyfuzji . Dane składa się z 100.000 renderingi każdy z obiektów Bunny i smok z Stanford skanowanie 3D repozytorium . W przyszłości może zostać dodanych więcej obiektów, ale w artykule wykorzystano tylko Królika i Smoka. Każdy obiekt jest renderowany z równomiernie próbkowanym oświetleniem z punktu na 2-sferze i równomiernie próbkowanym obrotem 3D. Prawdziwe stany ukryte są dostarczane jako tablice NumPy wraz z obrazami. Oświetlenie podane jest w postaci 3-wektorowej z jednostkową normą, natomiast obrót jest podany zarówno jako kwaternion, jak i macierz ortogonalna 3x3.

Istnieje wiele podobieństw między S3O4D i istniejących zbiorów danych porównawczych ML jak Norb , 3D Krzesła , kształtów 3D oraz wiele innych, które również zawierają tynk z zestawu obiektów w różnych warunkach pozie i oświetlenia. Jednak żaden z tych istniejących zbiorów danych obejmują cały kolektor obrotów w 3D - większość to tylko część zmian elewacji i azymutu. Obrazy S3O4D są próbkowane jednolicie i niezależnie od pełnej przestrzeni obrotów i iluminacji, co oznacza, że ​​zestaw danych zawiera obiekty odwrócone do góry nogami i oświetlone od tyłu lub od spodu. Uważamy, że to sprawia, że ​​S3O4D wyjątkowo nadaje się do badań nad modelami generatywnymi, w których przestrzeń utajona ma nietrywialną topologię, a także do ogólnych metod uczenia się, w których krzywizna jest ważna.

Podział Przykłady
'bunny_test' 20 000
'bunny_train' 80 000
'dragon_test' 20 000
'dragon_train' 80 000
  • Cechy:
FeaturesDict({
    'illumination': Tensor(shape=(3,), dtype=tf.float32),
    'image': Image(shape=(256, 256, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'pose_mat': Tensor(shape=(3, 3), dtype=tf.float32),
    'pose_quat': Tensor(shape=(4,), dtype=tf.float32),
})

Wyobrażanie sobie

  • cytat:
@article{pfau2020disentangling,
  title={Disentangling by Subspace Diffusion},
  author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
  S{\'e}bastian},
  journal={Advances in Neural Information Processing Systems (NeurIPS)},
  year={2020}
}