Bu sayfa, Cloud Translation API ile çevrilmiştir.
Switch to English

Trim önemsiz ağırlıklar

TensorFlow Modeli Optimizasyonu tarafından tutulan

Bu belge bunu kullanımı durumda ne kadar uygun belirlemek yardımına modeli budama bir bakış sağlar.

genel bakış

eğitim sürecinde aşamalı modeli ağırlıkları üzerinden sıfır budama Büyüklük tabanlı ağırlık modeli kıtlık elde etmek. Seyrek modeller kompres daha kolaydır ve biz gecikme iyileştirmeler için çıkarsama sırasında sıfır atlayabilirsiniz.

Bu teknik modeli sıkıştırma yoluyla iyileştirmeler getiriyor. Gelecekte, bu tekniğin çerçevesi destek gecikme iyileştirmeler sağlayacaktır. Biz doğruluk kaybıyla modeli sıkıştırma içinde 6x iyileştirmeler kadar gördüm.

teknik, konuşma tanıma ve metin-konuşma gibi çeşitli konuşma uygulamalarında değerlendirilmektedir ve çeşitli görme ve çeviri modeller arasında üzerinde denenmiştir.

API Uyumluluk Matrisi

Kullanıcılar aşağıdaki API'larla budama uygulayabilirsiniz:

  • Model bina: tf.keras sadece Sıralı ve Fonksiyonel modellerle
  • TensorFlow sürümleri: sürümler için TF 1.x 1.14+ ve 2.x
    • tf.compat.v1 bir TF 2.X paketi ve ile tf.compat.v2 bir TF 1.X paketi ile desteklenmez.
  • TensorFlow yürütme modunda: grafiktir ve istekli hem
  • Dağıtılmış eğitimi: tf.distribute sadece grafik yürütülmesine

Aşağıdaki alanlarda desteği eklemek için yol haritamızdadır:

Sonuçlar

Görüntü Sınıflandırma

model Sigara seyrek Üst 1 Doğruluk seyrek Doğruluk Kıtlık
InceptionV3 % 78.1 % 78.0 % 50
% 76.1 % 75
% 74.6 % 87.5
MobilenetV1 224 71.04% 70.84% % 50

Modeller IMAGEnet üzerinde test edildi.

Tercüme

model Sigara seyrek BLEU seyrek BLEU Kıtlık
GNMT TR DE 26.77 26.86 % 80
26.52 % 85
26.19 % 90
GNMT DE-TR 29.47 29.50 % 80
29.24 % 85
28.81 % 90

modeller test kümesi olarak dev seti ve haber-test2015 gibi haber-test2013 ile WMT16 Alman ve İngiliz veri kümesi kullanın.

Örnekler

Ek olarak Erik keras ile öğretici, aşağıdaki örneklere bakın:

  • Budama ile MNIST el yazısıyla haneli sınıflandırma görev üzerinde CNN modeli Train: kodu
  • Budama ile IMDB duyguları sınıflandırma görev üzerinde LSTM Train: kodu

Arka plan için, kuru erik için, ya da erik için bakınız: örnek sıkıştırma [için budama etkinliğini keşfetmek kağıt ].