TensorFlow Lite 로드맵

업데이트: 2021년 5월

다음은 로드맵을 높은 개요 수준에서 나타낸 것입니다. 이 로드맵은 언제든지 변경될 수 있으며 아래 순서는 어떤 형태의 우선순위도 반영하지 않는다는 점에 유의해 주세요.

로드맵을 사용성, 성능, 최적화 및 이식성의 네 가지 주요 부분으로 나눕니다. TensorFlow Lite 토론 그룹에서 로드맵에 대한 의견을 제시하고 피드백을 제공해줄 것을 적극 권장합니다.

사용성

  • 확장된 ops 범위
    • 사용자 피드백을 기초로 타겟팅된 연산을 추가합니다.
    • 임의 연산, 기본 Keras 레이어 연산, 해시 테이블, 특정 훈련 연산을 포함하여 특정 도메인 및 영역에 대해 타겟팅된 연산 세트를 추가합니다.
  • 더 많은 보조 도구
    • 훈련 중 및 변환 후 TFLite와 하드웨어 가속기 호환성을 검증하기 위한 TensorFlow 그래프 주석 및 호환성 도구를 제공합니다.
    • 전환하는 동안 특정 가속기에 대한 타겟팅 및 최적화를 허용합니다.
  • 장치 내 훈련
    • 엔드 투 엔드 사용을 시연하는 Colab을 포함하여 개인화 및 전이 학습을 위한 장치 내 훈련을 지원합니다.
    • 변수/리소스 유형을 지원합니다(추론 및 훈련 모두).
    • 여러 함수(또는 서명) 진입점으로 그래프 변환 및 실행을 지원합니다.
  • 향상된 Android Studio 통합
    • TFLite 모델을 Android Studio로 드래그 앤 드롭하여 모델 인터페이스를 생성합니다.
    • 메모리 프로파일링을 포함하여 Android Studio 프로파일링 지원을 개선합니다.
  • 모델 메이커
    • 객체 감지, 추천 및 오디오 분류를 포함한 새로운 과제를 지원하며 광범위한 일반적인 사용 사례를 포괄합니다.
    • 전이 학습을 더 쉽게 하기 위해 더 많은 데이터 세트를 지원합니다.
  • 작업 라이브러리
    • 관련 사전 및 사후 처리 기능으로 더 많은 모델 유형(예: 오디오, NLP)을 지원합니다.
    • Task API로 더 많은 참조 예제를 업데이트합니다.
    • 모든 과제에 대해 즉시 사용 가능한 가속을 지원합니다.
  • 더 많은 SOTA 모델 및 예제
    • 다양한 플랫폼을 포괄하는 새로운 기능 및 API뿐만 아니라 모델 사용을 보여주기 위해 더 많은 예제(예: 오디오, NLP, 구조 데이터 관련)를 추가합니다.
    • 장치용 공유 가능한 백본 모델을 생성하여 훈련 및 배포 비용을 줄입니다.
  • 여러 플랫폼에 걸쳐 원활한 배포
    • 웹에서 TensorFlow Lite 모델을 실행합니다.
  • 향상된 크로스 플랫폼 지원
    • Android의 Java, iOS의 Swift, RPi의 Python용 API를 확장하고 개선합니다.
    • CMake 지원을 강화합니다(예: 보다 광범위한 가속기 지원).
  • 개선된 프런트엔드 지원
    • Keras, tf.numpy를 포함한 다양한 저작 프런트엔드와의 호환성을 개선합니다.

성능

  • 개선된 도구
    • 각 릴리스의 성능 향상을 추적하기 위한 공개 대시보드
    • 대상 가속기와의 그래프 호환성을 더 잘 이해하기 위한 도구
  • 향상된 CPU 성능
    • 더 빠른 부동 소수점 추론을 위해 기본적으로 XNNPack이 활성화됩니다.
    • 최적화된 커널로 종단 간 절반 정밀도(float16)를 지원합니다.
  • 업데이트된 NN API 지원
    • 최신 Android 버전 NN API 기능, 연산 및 유형을 완벽하게 지원합니다.
  • GPU 최적화
    • 대리자 직렬화 지원으로 시작 시간이 향상됨
    • 제로 카피 추론을 위한 하드웨어 버퍼 상호 운용성
    • 장치 가속을 더 폭넓게 이용 가능
    • 개선된 연산 범위

최적화

  • 양자화

    • 양자화에서 특정 레이어를 제외하기 위한 선택적 훈련 후 양자화
    • 각 레이어별 양자화 오류 손실을 검사하는 양자화 디버거
    • TensorFlow Model Garden과 같은 더 많은 모델 적용 범위에 양자화 인식 훈련 적용
    • 훈련 후 동적 범위 양자화를 위한 품질 및 성능 향상
    • SVD와 같은 압축 알고리즘을 이용하기 위한 Tensor Compression API
  • 잘라내기/희소성

    • 구성 가능한 훈련 시간(잘라내기 + 양자화 인식 훈련) API를 결합합니다.
    • TF Model Garden 모델에서 희소성 적용을 늘립니다.
    • TensorFlow Lite에서 희소 모델 실행 지원

이식성

  • 마이크로컨트롤러 지원
    • 음성 및 이미지 분류를 위한 다양한 32bit MCU 아키텍처 사용 사례에 대한 지원 추가
    • 오디오 프런트엔드: 그래프 내 오디오 사전 처리 및 가속 지원
    • 시각 및 오디오 데이터용 샘플 코드 및 모델