Bangun model TensorFlow Lite

Halaman ini memberikan panduan untuk membuat model TensorFlow Anda dengan tujuan mengonversi ke format model TensorFlow Lite. Model pembelajaran mesin (ML) yang Anda gunakan dengan TensorFlow Lite awalnya dibuat dan dilatih menggunakan library dan alat inti TensorFlow. Setelah membuat model dengan inti TensorFlow, Anda dapat mengonversinya ke format model ML yang lebih kecil dan lebih efisien yang disebut model TensorFlow Lite.

  • Jika Anda sudah memiliki model untuk dikonversi, lihat halaman Ikhtisar konversi model untuk panduan dalam mengonversi model Anda.

  • Jika Anda ingin memodifikasi model yang sudah ada daripada memulai dari awal, lihat ikhtisar Modifikasi model untuk panduan.

Membangun model Anda

Jika Anda membuat model kustom untuk kasus penggunaan spesifik Anda, Anda harus mulai dengan mengembangkan dan melatih model TensorFlow atau memperluas yang sudah ada.

Batasan desain model

Sebelum memulai proses pengembangan model, Anda harus mengetahui batasan untuk model TensorFlow Lite dan membuat model dengan mempertimbangkan batasan berikut:

  • Kemampuan komputasi terbatas - Dibandingkan dengan server yang lengkap dengan banyak CPU, kapasitas memori tinggi, dan prosesor khusus seperti GPU dan TPU, perangkat seluler dan edge jauh lebih terbatas. Sementara mereka tumbuh dalam kekuatan komputasi dan kompatibilitas perangkat keras khusus, model dan data yang dapat Anda proses secara efektif dengannya masih sangat terbatas.
  • Ukuran model - Kompleksitas model secara keseluruhan, termasuk logika pra-pemrosesan data dan jumlah lapisan dalam model, meningkatkan ukuran model dalam memori. Model besar mungkin berjalan sangat lambat atau mungkin tidak muat di memori perangkat seluler atau edge yang tersedia.
  • Ukuran data - Ukuran data input yang dapat diproses secara efektif dengan model pembelajaran mesin terbatas pada perangkat seluler atau edge. Model yang menggunakan pustaka data besar seperti pustaka bahasa, pustaka gambar, atau pustaka klip video mungkin tidak muat di perangkat ini, dan mungkin memerlukan penyimpanan di luar perangkat dan solusi akses.
  • Operasi TensorFlow yang didukung - Lingkungan runtime TensorFlow Lite mendukung subset operasi model pembelajaran mesin dibandingkan dengan model TensorFlow biasa. Saat Anda mengembangkan model untuk digunakan dengan TensorFlow Lite, Anda harus melacak kompatibilitas model Anda dengan kemampuan lingkungan runtime TensorFlow Lite.

Untuk informasi selengkapnya tentang pembuatan model yang efektif, kompatibel, dan berkinerja tinggi untuk TensorFlow Lite, lihat Praktik terbaik kinerja .

Pengembangan model

Untuk membuat model TensorFlow Lite, Anda harus terlebih dahulu membuat model menggunakan pustaka inti TensorFlow. Pustaka inti TensorFlow adalah pustaka tingkat rendah yang menyediakan API untuk membuat, melatih, dan menerapkan model ML.

Alur kerja pembuatan TFLite

TensorFlow menyediakan dua jalur untuk melakukan ini. Anda dapat mengembangkan kode model kustom Anda sendiri atau memulai dengan implementasi model yang tersedia di TensorFlow Model Garden .

Taman Model

TensorFlow Model Garden menyediakan implementasi dari banyak model pembelajaran mesin (ML) yang canggih untuk penglihatan dan pemrosesan bahasa alami (NLP). Anda juga akan menemukan alat alur kerja untuk memungkinkan Anda mengonfigurasi dan menjalankan model tersebut dengan cepat pada kumpulan data standar. Model pembelajaran mesin di Model Garden menyertakan kode lengkap sehingga Anda dapat menguji, melatih, atau melatihnya kembali menggunakan set data Anda sendiri.

Baik Anda ingin membandingkan kinerja untuk model terkenal, memverifikasi hasil penelitian yang baru dirilis, atau memperluas model yang ada, Model Garden dapat membantu Anda mendorong sasaran ML Anda.

Model khusus

Jika kasus penggunaan Anda di luar yang didukung oleh model di Model Garden, Anda dapat menggunakan perpustakaan tingkat tinggi seperti Keras untuk mengembangkan kode pelatihan kustom Anda. Untuk mempelajari dasar-dasar TensorFlow, lihat panduan TensorFlow . Untuk memulai dengan contoh, lihat ikhtisar tutorial TensorFlow yang berisi petunjuk untuk memulai tutorial tingkat ahli.

Evaluasi model

Setelah Anda mengembangkan model Anda, Anda harus mengevaluasi kinerjanya dan mengujinya pada perangkat pengguna akhir. TensorFlow menyediakan beberapa cara untuk melakukan ini.

  • TensorBoard adalah alat untuk menyediakan pengukuran dan visualisasi yang diperlukan selama alur kerja machine learning. Ini memungkinkan pelacakan metrik eksperimen seperti kehilangan dan akurasi, memvisualisasikan grafik model, memproyeksikan embeddings ke ruang dimensi yang lebih rendah, dan banyak lagi.
  • Alat benchmark tersedia untuk setiap platform yang didukung seperti aplikasi benchmark Android dan aplikasi benchmark iOS. Gunakan alat ini untuk mengukur dan menghitung statistik untuk metrik kinerja yang penting.

Optimalisasi model

Dengan batasan pada sumber daya khusus untuk model TensorFlow Lite, pengoptimalan model dapat membantu memastikan kinerja model Anda dengan baik dan menggunakan lebih sedikit sumber daya komputasi. Performa model pembelajaran mesin biasanya merupakan keseimbangan antara ukuran dan kecepatan inferensi vs akurasi. TensorFlow Lite saat ini mendukung pengoptimalan melalui kuantisasi, pemangkasan, dan pengelompokan. Lihat topik pengoptimalan model untuk detail selengkapnya tentang teknik ini. TensorFlow juga menyediakan toolkit pengoptimalan Model yang menyediakan API yang mengimplementasikan teknik ini.

Langkah selanjutnya