Metin sınıflandırması

Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.

Bir paragrafı önceden tanımlanmış gruplara kategorize etmek için bir TensorFlow Lite modeli kullanın.

Başlamak

TensorFlow Lite'ta yeniyseniz ve Android ile çalışıyorsanız, metin sınıflandırma modellerini yalnızca birkaç satır kod içinde entegre etmek için TensorFLow Lite Görev Kitaplığı kılavuzunu keşfetmenizi öneririz. Modeli ayrıca TensorFlow Lite Yorumlayıcı Java API'sini kullanarak da entegre edebilirsiniz.

Aşağıdaki Android örneği, sırasıyla lib_task_api ve lib_interpreter olarak her iki yöntemin uygulamasını gösterir.

Android örneği

Android dışında bir platform kullanıyorsanız veya TensorFlow Lite API'lerini zaten biliyorsanız, başlangıç ​​metni sınıflandırma modelimizi indirebilirsiniz.

Başlangıç ​​modelini indirin

Nasıl çalışır

Metin sınıflandırması, bir paragrafı içeriğine göre önceden tanımlanmış gruplara ayırır.

Bu önceden eğitilmiş model, bir paragrafın duyarlılığının olumlu mu yoksa olumsuz mu olduğunu tahmin eder. Olumlu veya olumsuz olarak etiketlenmiş IMDB film incelemelerinden oluşan Mass ve arkadaşlarının Büyük Film İnceleme Veri Kümesi v1.0 üzerinde eğitildi.

Modelle bir paragrafı sınıflandırma adımları şunlardır:

  1. Paragrafı simge haline getirin ve önceden tanımlanmış bir kelime dağarcığı kullanarak bir kelime kimlikleri listesine dönüştürün.
  2. Listeyi TensorFlow Lite modeline besleyin.
  3. Model çıktılarından paragrafın pozitif veya negatif olma olasılığını bulun.

Not

  • Yalnızca İngilizce desteklenir.
  • Bu model, film incelemeleri veri kümesi üzerinde eğitilmiştir, bu nedenle diğer etki alanlarının metinlerini sınıflandırırken düşük doğrulukla karşılaşabilirsiniz.

Performans karşılaştırmaları

Performans kıyaslama numaraları burada açıklanan araçla oluşturulur.

Model adı Model boyutu Cihaz İşlemci
Metin Sınıflandırma 0,6 Mb Piksel 3 (Android 10) 0,05 ms*
Piksel 4 (Android 10) 0,05 ms*
iPhone XS (iOS 12.4.1) 0,025 ms**

* 4 iplik kullanılmıştır.

** En iyi performans sonucu için iPhone'da kullanılan 2 iş parçacığı.

Örnek çıktı

Metin negatif (0) pozitif (1)
Bu son yıllarda izlediğim en iyi film. Şiddetle tavsiye ederim! %25.3 %74.7
Ne zaman kaybım. %72,5 %27.5

Eğitim veri kümenizi kullanın

Kendi veri kümelerinizi kullanarak bir metin sınıflandırma modelini eğitmek için burada kullanılan tekniğin aynısını uygulamak için bu öğreticiyi izleyin. Doğru veri seti ile belge kategorizasyonu veya toksik yorum tespiti gibi kullanım durumları için bir model oluşturabilirsiniz.

Metin sınıflandırması hakkında daha fazla bilgi edinin