Tarihi kaydet! Google I / O 18-20 Mayıs'ta geri dönüyor Şimdi kaydolun
Bu sayfa, Cloud Translation API ile çevrilmiştir.
Switch to English

Metin sınıflandırması

Bir paragrafı önceden tanımlanmış gruplar halinde kategorilere ayırmak için önceden eğitilmiş bir model kullanın.

Başlamak

TensorFlow Lite'ta yeniyseniz ve Android ile çalışıyorsanız, metin sınıflandırma modellerini sadece birkaç satır kodla entegre etmek için TensorFLow Lite Görev Kitaplığı kılavuzunu incelemenizi öneririz . Modeli TensorFlow Lite Interpreter Java API kullanarak da entegre edebilirsiniz.

Aşağıdaki Android örneği, sırasıyla lib_task_api ve lib_interpreter olarak her iki yöntemin uygulamasını gösterir.

Android örneği

Android dışında bir platform kullanıyorsanız veya TensorFlow Lite API'lerine aşina iseniz, başlangıç ​​metin sınıflandırma modelimizi indirebilirsiniz.

Başlangıç ​​modelini indirin

Nasıl çalışır

Metin sınıflandırması, bir paragrafı içeriğine göre önceden tanımlanmış gruplara ayırır.

Bu önceden eğitilmiş model, bir paragrafın duyarlılığının olumlu mu yoksa olumsuz mu olduğunu tahmin eder. Pozitif veya negatif olarak etiketlenmiş IMDB film incelemelerinden oluşan Mass ve diğerlerinden Büyük Film İnceleme Veri Kümesi v1.0 üzerinde eğitilmiştir.

Modelle bir paragrafı sınıflandırmanın adımları şunlardır:

  1. Paragrafı şifreleyin ve önceden tanımlanmış bir kelime dağarcığı kullanarak onu bir kelime kimlikleri listesine dönüştürün.
  2. Listeyi TensorFlow Lite modeline besleyin.
  3. Model çıktılarından paragrafın pozitif veya negatif olma olasılığını alın.

Not

  • Yalnızca İngilizce desteklenmektedir.
  • Bu model, film incelemeleri veri kümesine göre eğitilmiştir, bu nedenle diğer alanların metinlerini sınıflandırırken daha düşük doğruluk yaşayabilirsiniz.

Performans testleri

Performans karşılaştırma numaraları, burada açıklanan araçla oluşturulur.

Model adı Model boyutu cihaz İşlemci
Metin Sınıflandırması 0.6 Mb Pixel 3 (Android 10) 0,05 ms *
Pixel 4 (Android 10) 0,05 ms *
iPhone XS (iOS 12.4.1) 0,025 ms **

* 4 iplik kullanıldı.

** En iyi performans sonucu için iPhone'da kullanılan 2 iş parçacığı.

Örnek çıktı

Metin Olumsuz (0) Olumlu (1)
Bu son yıllarda izlediğim en iyi film. Kesinlikle tavsiye ederim! % 25.3 % 74.7
Ne kadar zaman kaybı. % 72,5 % 27.5

Eğitim veri kümenizi kullanın

Kendi veri kümelerinizi kullanarak bir metin sınıflandırma modeli eğitmek için burada kullanılan aynı tekniği uygulamak için bu öğreticiyi izleyin. Doğru veri kümesiyle, belge kategorizasyonu veya toksik yorum tespiti gibi kullanım durumları için bir model oluşturabilirsiniz.

Metin sınıflandırması hakkında daha fazlasını okuyun