Ta strona została przetłumaczona przez Cloud Translation API.
Switch to English

Przegląd

W ostatnich kilku latach obserwuje się wzrost nowych warstw różniczkowalne graficznych, które można wstawić w neuronowych architektur sieciowych. Od transformatorów przestrzennych różniczkowalnych renderujących graficznych, te nowe warstwy wykorzystać wiedza zdobyta przez lata wizji i grafiki komputerowej badania na budowę nowych i bardziej wydajnych architektur sieciowych. Wyraźnie geometryczne modelowanie prawdopodobieństwa a priori i ograniczeń w sieciach neuronowych otwiera drzwi do architektur, które mogą być przeszkolony solidnie, sprawnie, a co ważniejsze, w własnym nadzorowany mody.

Na wysokim poziomie, rurociąg grafika komputerowa wymaga reprezentacji obiektów 3D oraz ich pozycjonowanie bezwzględne w scenie, opis materiału, z jakiego są wykonane, światła i kamery. Ten opis sceny jest następnie interpretowany przez renderer do generowania syntetyczny rendering.

Dla porównania, system wizyjny komputer ruszy z obrazu i spróbować wnioskować parametrów sceny. Pozwala to na przewidywaniu, które obiekty są na scenie, jakie materiały są wykonane iw pozycji trójwymiarowej i orientację.

Szkolenie systemy maszynowe uczenie zdolnych do rozwiązywania tych złożonych zadań 3D Vision najczęściej wymaga dużych ilości danych. Jak znakowanie danych jest kosztowny i skomplikowany proces, ważne jest, aby mieć mechanizmy konstrukcji maszyn uczenie modeli, które można zrozumieć trójwymiarowy świat będąc przeszkolony bez większego nadzoru. Łącząc wizji komputerowej i technik grafiki komputerowej zapewnia unikalną możliwość wykorzystania ogromnych ilości łatwo dostępnych danych oznakowanych. Jak przedstawiono na rysunku poniżej, można, na przykład, być osiągnięte za pomocą analizy przez syntezę, gdy system wizyjny wydobywa parametry sceny i układ graficzny obraz powoduje powrót na ich podstawie. Jeśli renderowania pasuje do oryginalnego obrazu, system wizyjny został dokładnie wyodrębnione parametry ujęciami. W tej konfiguracji, wizja komputera i grafiki komputerowej iść w parze, tworząc jednolity system uczenia maszynowego podobną do autoencoder, które mogą być przeszkoleni w zakresie samodzielnego nadzorowany sposób.

Tensorflow Graphics jest rozwijany, aby pomóc w rozwiązaniu tego typu problemów i aby to zrobić, to zapewnia zestaw różniczkowalnych grafiki i warstw geometrycznych (np kamer, modele odbicia, przemian przestrzennych, siatki zwoje) i 3D funkcje podglądu (np 3D TensorBoard), które mogą być używane do szkolenia i debugowania urządzenia modele wyboru nauki.