Metin sınıflandırması

Bir paragrafı önceden tanımlanmış gruplara ayırmak için TensorFlow Lite modelini kullanın.

Başlamak

TensorFlow Lite'ta yeniyseniz ve Android ile çalışıyorsanız, metin sınıflandırma modellerini yalnızca birkaç satır kodla entegre etmek için TensorFLow Lite Görev Kitaplığı kılavuzunu incelemenizi öneririz. Modeli TensorFlow Lite Interpreter Java API'sini kullanarak da entegre edebilirsiniz.

Aşağıdaki Android örneği, her iki yöntemin uygulamasını sırasıyla lib_task_api ve lib_interpreter olarak göstermektedir.

Android örneği

Android dışında bir platform kullanıyorsanız veya TensorFlow Lite API'lerine zaten aşina iseniz başlangıç ​​metni sınıflandırma modelimizi indirebilirsiniz.

Başlangıç ​​modelini indirin

Nasıl çalışır

Metin sınıflandırması, bir paragrafı içeriğine göre önceden tanımlanmış gruplara ayırır.

Bu önceden eğitilmiş model, bir paragrafın duygusunun olumlu mu yoksa olumsuz mu olduğunu tahmin eder. Olumlu veya olumsuz olarak etiketlenen IMDB film incelemelerinden oluşan Mass ve diğerlerinin Large Movie Review Dataset v1.0'ı üzerine eğitildi.

Bir paragrafı modelle sınıflandırmanın adımları şunlardır:

  1. Paragrafı simgeleştirin ve önceden tanımlanmış bir kelime dağarcığı kullanarak onu bir kelime kimlikleri listesine dönüştürün.
  2. Listeyi TensorFlow Lite modeline besleyin.
  3. Model çıktılarından paragrafın olumlu ya da olumsuz olma olasılığını öğrenin.

Not

  • Yalnızca İngilizce desteklenmektedir.
  • Bu model, film incelemeleri veri kümesi üzerinde eğitildiğinden, diğer etki alanlarının metinlerini sınıflandırırken doğrulukta azalma yaşayabilirsiniz.

Performans kıyaslamaları

Performans kıyaslama numaraları burada açıklanan araçla oluşturulur.

Model adı Modeli boyutu Cihaz İşlemci
Metin Sınıflandırması 0,6 MB Piksel 3 (Android 10) 0,05 ms*
Piksel 4 (Android 10) 0,05 ms*
iPhone XS (iOS 12.4.1) 0,025 ms**

* 4 konu kullanıldı.

** En iyi performans sonucu için iPhone'da 2 iş parçacığı kullanıldı.

Örnek çıktı

Metin Negatif (0) Olumlu (1)
Bu son yıllarda izlediğim en iyi film. Kesinlikle tavsiye ederim! %25,3 %74,7
Ne büyük zaman kaybı. %72,5 %27,5

Eğitim veri kümenizi kullanın

Kendi veri kümelerinizi kullanarak bir metin sınıflandırma modelini eğitmek için burada kullanılan tekniğin aynısını uygulamak için bu öğreticiyi izleyin. Doğru veri kümesiyle belge kategorizasyonu veya zararlı yorum tespiti gibi kullanım durumları için bir model oluşturabilirsiniz.

Metin sınıflandırması hakkında daha fazlasını okuyun