Bantuan melindungi Great Barrier Reef dengan TensorFlow pada Kaggle Bergabung Tantangan

Klasifikasi teks

Gunakan model TensorFlow Lite untuk mengategorikan paragraf ke dalam grup yang telah ditentukan sebelumnya.

Memulai

Jika Anda baru mengenal TensorFlow Lite dan menggunakan Android, sebaiknya pelajari panduan Pustaka Tugas TensorFLow Lite untuk mengintegrasikan model klasifikasi teks hanya dalam beberapa baris kode. Anda juga dapat mengintegrasikan model menggunakan TensorFlow Lite Interpreter Java API .

Contoh Android di bawah ini mendemonstrasikan implementasi untuk kedua metode tersebut sebagai lib_task_api dan lib_interpreter .

Contoh Android

Jika Anda menggunakan platform selain Android, atau Anda sudah terbiasa dengan TensorFlow Lite API, Anda dapat mendownload model klasifikasi teks awal kami.

Unduh model permulaan

Bagaimana itu bekerja

Klasifikasi teks mengategorikan paragraf ke dalam grup yang telah ditentukan berdasarkan isinya.

Model yang dilatih sebelumnya ini memprediksi apakah sentimen paragraf positif atau negatif. Itu dilatih pada Large Movie Review Dataset v1.0 dari Mass et al, yang terdiri dari review film IMDB yang diberi label sebagai positif atau negatif.

Berikut langkah-langkah untuk mengklasifikasikan paragraf dengan model:

  1. Buat token paragraf dan konversikan menjadi daftar id kata menggunakan kosakata yang telah ditentukan.
  2. Masukkan daftar ke model TensorFlow Lite.
  3. Dapatkan probabilitas paragraf menjadi positif atau negatif dari keluaran model.

Catatan

  • Hanya bahasa Inggris yang didukung.
  • Model ini dilatih pada kumpulan data ulasan film sehingga Anda mungkin mengalami penurunan keakuratan saat mengklasifikasikan teks dari domain lain.

Tolok ukur kinerja

Angka tolok ukur kinerja dibuat dengan alat yang dijelaskan di sini .

Nama model Ukuran model Alat CPU
Klasifikasi Teks 0,6 Mb Pixel 3 (Android 10) 0,05 md *
Pixel 4 (Android 10) 0,05 md *
iPhone XS (iOS 12.4.1) 0,025 md **

* 4 utas digunakan.

** 2 utas digunakan di iPhone untuk hasil kinerja terbaik.

Contoh keluaran

Teks Negatif (0) Positif (1)
Ini adalah film terbaik yang pernah saya lihat dalam beberapa tahun terakhir. Sangat merekomendasikannya! 25,3% 74,7%
Buang-buang waktuku. 72,5% 27,5%

Gunakan set data pelatihan Anda

Ikuti tutorial ini untuk menerapkan teknik yang sama yang digunakan di sini untuk melatih model klasifikasi teks menggunakan kumpulan data Anda sendiri. Dengan set data yang tepat, Anda dapat membuat model untuk kasus penggunaan seperti kategorisasi dokumen atau deteksi komentar beracun.

Baca lebih lanjut tentang klasifikasi teks