이 페이지는 Cloud Translation API를 통해 번역되었습니다.
Switch to English

텍스트 분류

사전 학습 된 모델을 사용하여 단락을 사전 정의 된 그룹으로 분류합니다.

시작하다

TensorFlow Lite를 처음 사용하고 Android로 작업하는 경우 시작하는 데 도움이 될 수있는 다음 예제 애플리케이션을 탐색하는 것이 좋습니다.

Android 예

Android 이외의 플랫폼을 사용 중이거나 TensorFlow Lite API에 이미 익숙한 경우 시작 텍스트 분류 모델을 다운로드 할 수 있습니다.

스타터 모델 다운로드

작동 원리

텍스트 분류는 내용에 따라 미리 정의 된 그룹으로 단락을 분류합니다.

이 사전 훈련 된 모델은 단락의 감정이 긍정적인지 부정적인지 예측합니다. Mass et al의 Large Movie Review Dataset v1.0에 대해 학습 되었으며, 이는 긍정적 또는 부정적이라고 표시된 IMDB 영화 리뷰로 구성됩니다.

모델로 단락을 분류하는 단계는 다음과 같습니다.

  1. 단락을 토큰 화하고 사전 정의 된 어휘를 사용하여 단어 ID 목록으로 변환하십시오.
  2. TensorFlow Lite 모델에 목록을 제공합니다.
  3. 모델 출력에서 ​​단락이 양수 또는 음수 일 확률을 가져옵니다.

노트

  • 영어 만 지원됩니다.
  • 이 모델은 영화 리뷰 데이터 세트에서 학습되었으므로 다른 도메인의 텍스트를 분류 할 때 정확도가 떨어질 수 있습니다.

성능 벤치 마크

여기에 설명 된 도구를 사용하여 성능 벤치 마크 수치가 생성 됩니다 .

모델명 모델 사이즈 장치 CPU
텍스트 분류 0.6Mb Pixel 3 (Android 10) 0.05ms *
Pixel 4 (Android 10) 0.05ms *
iPhone XS (iOS 12.4.1) 0.025ms **

* 4 개의 스레드가 사용되었습니다.

** 최고의 성능을 위해 iPhone에서 2 개의 스레드가 사용되었습니다.

예제 출력

본문 부정적 (0) 긍정적 (1)
이것은 내가 최근에 본 최고의 영화입니다. 강력히 추천합니다! 25.3 % 74.7 %
내 시간 낭비입니다. 72.5 % 27.5 %

훈련 데이터 세트 사용

자습서 를 따라 여기에 사용 된 것과 동일한 기술을 적용하여 고유 한 데이터 세트를 사용하여 텍스트 분류 모델을 학습 시키십시오. 올바른 데이터 세트를 사용하면 문서 분류 또는 독성 댓글 감지와 같은 사용 사례에 대한 모델을 만들 수 있습니다.

텍스트 분류에 대해 자세히 알아보기