本頁面由 Cloud Translation API 翻譯而成。
Switch to English

權聚類

由ARM ML工具保持

此文件提供了關於權聚類的概述,以幫助您確定如何與你的使用情況相符。

概觀

群集,或重量共享,減少了在模型唯一的權重值的數量,導致部署的好處。它第一組的每一層成N個簇的權重,然後對共享所有屬於集群的權重群集的質心值。

這種技術帶來的通過模型壓縮改進。未來框架的支持可以解鎖內存佔用的改進,可以使一個關鍵的區別關於和資源受限的嵌入式系統上部署深度學習模型。

我們已經嘗試了跨越視覺和語音任務集群。我們已經看到高達5倍的改進模型壓縮精度的損失最小,被作為展示的結果如下。

請注意,群集將提供一種用於先於批標準化層,以及在每個軸後的培訓量化組合卷積和緻密層減少的好處。

API兼容性矩陣

用戶可以應用聚類以下API:

  • 建立模型: tf.keras只有順序和功能模型
  • TensorFlow版本:TF的1.x版本為1.14+和2.x版本
    • tf.compat.v1與TF 2.X包和tf.compat.v2不支持用TF 1.X包。
  • TensorFlow執行模式:兩個曲線圖,渴望

結果

圖像分類

模型原版的集群
頂-1精度(%) 壓縮.tflite的大小(MB) 組態集群# 頂-1精度(%) 壓縮.tflite的大小(MB)
MobileNetV1 71.02 14.96
選擇性的(過去的3 Conv2D層) 256,256,32 70.62 8.42
完全(所有Conv2D層) 64 66.07 2.98
MobileNetV2 72.29 12.90
選擇性的(過去的3 Conv2D層) 256,256,32 72.31 7.00
完全(所有Conv2D層) 32 69.33 2.60

這些模型進行了培訓和測試ImageNet。

關鍵詞檢測

模型原版的集群
頂-1精度(%) 壓縮.tflite的大小(MB) 組態集群# 頂-1精度(%) 壓縮.tflite的大小(MB)
DS-CNN-L 95.03 1.5 充分 32 94.71 0.3

這些模型進行了培訓和SpeechCommands v0.02測試。

  1. 序列化Keras模型到.h5文件
  2. 轉換.h5文件到使用.tflite TFLiteConverter.from_keras_model_file()
  3. 壓縮.tflite文件壓縮成zip

例子

除了在Keras例如重量集群 ,看下面的例子:

  • 集群訓練有素的MNIST手寫數字分類數據集模型CNN的權重: 代碼

重量集群的實現是基於深度壓縮:壓縮深層神經網絡,剪枝,訓練有素的量化和霍夫曼編碼 。見第3章,標題為訓練有素的量化和重量共享