이 페이지는 Cloud Translation API를 통해 번역되었습니다.
Switch to English

분할

시작하다

DeepLab 은 의미 론적 이미지 분할을위한 최첨단 딥 러닝 모델로, 목표는 입력 이미지의 모든 픽셀에 의미 론적 레이블 (예 : 사람, 개, 고양이)을 할당하는 것입니다.

TensorFlow Lite를 처음 사용하고 Android 또는 iOS로 작업하는 경우 시작하는 데 도움이되는 다음 예제 애플리케이션을 탐색하는 것이 좋습니다.

Android 예

iOS 예

Android 또는 iOS 이외의 플랫폼을 사용 중이거나 TensorFlow Lite API에 이미 익숙한 경우 시작 이미지 분할 모델을 다운로드 할 수 있습니다.

스타터 모델 다운로드

작동 원리

시맨틱 이미지 분할은 이미지의 각 픽셀이 특정 클래스와 연관되어 있는지 여부를 예측합니다. 이는 대조적이다 물체 검출 직사각형 영역에서 객체를 검출하고, 화상 분류 전체 이미지를 분류한다.

현재 구현에는 다음 기능이 포함됩니다.

  1. DeepLabv1 : 심층 컨볼 루션 신경망 내에서 특성 응답이 계산되는 해상도를 명시 적으로 제어하기 위해 atrous convolution을 사용합니다.
  2. DeepLabv2 : ASPP (atrous spatial pyramid pooling)를 사용하여 여러 샘플링 속도와 효과적인 시야각에서 필터를 사용하여 여러 척도에서 객체를 강력하게 분할합니다.
  3. DeepLabv3 : 더 긴 범위의 정보를 캡처하기 위해 이미지 레벨 기능 [5, 6]으로 ASPP 모듈을 확장합니다. 훈련을 용이하게하기 위해 배치 정규화 [7] 매개 변수도 포함합니다. 특히 훈련 및 평가 중에 서로 다른 출력 보폭에서 출력 특성을 추출하기 위해 atrous convolution을 적용하여 출력 보폭 = 16에서 BN을 효율적으로 학습시킬 수 있고 평가 중에 출력 보폭 = 8에서 높은 성능을 달성합니다.
  4. DeepLabv3 + : DeepLabv3를 확장하여 특히 객체 경계를 따라 세분화 결과를 개선하기 위해 간단하면서도 효과적인 디코더 모듈을 포함합니다. 또한,이 인코더-디코더 구조에서 추출 된 인코더 기능의 분해능을 정밀도와 런타임을 절충하는 강력한 컨볼 루션으로 임의로 제어 할 수 있습니다.

성능 벤치 마크

여기에 설명 된 도구를 사용하여 성능 벤치 마크 수치가 생성 됩니다 .

모델명 모델 사이즈 장치 GPU CPU
Deeplab v3 2.7Mb Pixel 3 (Android 10) 16ms 37ms *
Pixel 4 (Android 10) 20ms 23ms *
iPhone XS (iOS 12.4.1) 16ms 25ms **

* 4 개의 스레드가 사용되었습니다.

** 최고의 성능 결과를 위해 iPhone에서 2 개의 스레드가 사용되었습니다.

예제 출력

모델은 높은 정확도로 대상 물체 위에 마스크를 생성합니다.

이미지 분할을 보여주는 애니메이션

세분화에 대해 자세히 알아보기