Peta Jalan TensorFlow Lite

Diperbarui: Mei 2021

Berikut ini merupakan ikhtisar tingkat tinggi dari peta jalan kami. Anda harus menyadari bahwa peta jalan ini dapat berubah sewaktu-waktu dan urutan di bawah ini tidak mencerminkan prioritas apa pun.

Kami membagi peta jalan kami menjadi empat segmen utama: kegunaan, kinerja, optimalisasi, dan portabilitas. Kami sangat menganjurkan Anda untuk mengomentari peta jalan kami dan memberikan masukan di grup diskusi TensorFlow Lite .

Kegunaan

  • Cakupan operasi diperluas
    • Tambahkan operasi yang ditargetkan berdasarkan masukan pengguna.
    • Tambahkan set operasi yang ditargetkan untuk domain dan area tertentu termasuk operasi Acak, operasi lapisan Keras dasar, tabel hash, operasi pelatihan tertentu.
  • Perkakas yang lebih membantu
    • Menyediakan anotasi grafik TensorFlow dan alat kompatibilitas untuk memvalidasi kompatibilitas TFLite dan akselerator perangkat keras selama pelatihan dan setelah konversi.
    • Izinkan penargetan dan pengoptimalan untuk akselerator tertentu selama konversi.
  • Pelatihan di perangkat
    • Mendukung pelatihan di perangkat untuk personalisasi dan pembelajaran transfer, termasuk Colab yang menunjukkan penggunaan menyeluruh.
    • Variabel pendukung/jenis sumber daya (baik untuk inferensi dan pelatihan)
    • Mendukung konversi dan eksekusi grafik dengan titik masuk beberapa fungsi (atau tanda tangan).
  • Integrasi Android Studio yang ditingkatkan
    • Tarik dan lepas model TFLite ke Android Studio untuk menghasilkan antarmuka model.
    • Meningkatkan dukungan pembuatan profil Android Studio, termasuk pembuatan profil memori.
  • Pembuat Model
    • Mendukung tugas-tugas baru, termasuk deteksi objek, rekomendasi, dan klasifikasi audio, yang mencakup beragam penggunaan umum.
    • Mendukung lebih banyak kumpulan data untuk membuat pembelajaran transfer lebih mudah.
  • Perpustakaan Tugas
    • Mendukung lebih banyak jenis model (misalnya audio, NLP) dengan kemampuan pemrosesan sebelum dan sesudah terkait.
    • Perbarui lebih banyak contoh referensi dengan Task API.
    • Mendukung akselerasi out-of-the-box untuk semua tugas.
  • Lebih banyak model dan contoh SOTA
    • Tambahkan lebih banyak contoh (misalnya audio, NLP, terkait struktur data) untuk mendemonstrasikan penggunaan model serta fitur dan API baru, yang mencakup berbagai platform.
    • Buat model tulang punggung yang dapat dibagikan di perangkat guna mengurangi biaya pelatihan dan penerapan.
  • Penerapan yang mulus di berbagai platform
    • Jalankan model TensorFlow Lite di web.
  • Peningkatan dukungan lintas platform
    • Perluas dan tingkatkan API untuk Java di Android, Swift di iOS, Python di RPi.
    • Meningkatkan dukungan CMake (misalnya, dukungan akselerator yang lebih luas).
  • Dukungan frontend yang lebih baik
    • Tingkatkan kompatibilitas dengan berbagai frontend pembuatan, termasuk Keras, tf.numpy.

Pertunjukan

  • Perkakas yang lebih baik
    • Dasbor publik untuk melacak peningkatan kinerja pada setiap rilis.
    • Peralatan untuk lebih memahami kompatibilitas grafik dengan akselerator target.
  • Peningkatan kinerja CPU
    • XNNPack diaktifkan secara default untuk inferensi floating point yang lebih cepat.
    • Dukungan setengah presisi ujung ke ujung (float16) dengan kernel yang dioptimalkan.
  • Dukungan NN API yang diperbarui
    • Dukungan penuh untuk fitur, operasi, dan jenis NN API versi Android yang lebih baru.
  • Optimasi GPU
    • Peningkatan waktu startup dengan dukungan serialisasi delegasi.
    • Interop buffer perangkat keras untuk inferensi tanpa penyalinan.
    • Ketersediaan akselerasi pada perangkat yang lebih luas.
    • Cakupan operasi yang lebih baik.

Optimasi

  • Kuantisasi

    • Kuantisasi pasca pelatihan selektif untuk mengecualikan lapisan tertentu dari kuantisasi.
    • Debugger kuantisasi untuk memeriksa kerugian kesalahan kuantisasi per setiap lapisan.
    • Menerapkan pelatihan sadar kuantisasi pada cakupan model yang lebih banyak, misalnya TensorFlow Model Garden.
    • Peningkatan kualitas dan kinerja untuk kuantisasi rentang dinamis pasca pelatihan.
    • Tensor Compression API untuk memungkinkan algoritma kompresi seperti SVD.
  • Pemangkasan / ketersebaran

    • Gabungkan API waktu pelatihan (pemangkasan + pelatihan sadar kuantisasi) yang dapat dikonfigurasi.
    • Meningkatkan penerapan sparity pada model TF Model Garden.
    • Dukungan eksekusi model renggang di TensorFlow Lite.

Portabilitas

  • Dukungan Mikrokontroler
    • Tambahkan dukungan untuk berbagai kasus penggunaan arsitektur MCU 32-bit untuk klasifikasi ucapan dan gambar.
    • Audio Frontend: Dukungan akselerasi dan pra-pemrosesan audio dalam grafik
    • Contoh kode dan model untuk data penglihatan dan audio.