Эта страница была переведа с помощью Cloud Translation API.
Switch to English

Обрезка незначительные веса

Поддержка TensorFlow Модель оптимизация

В этом документе содержится обзор модели обрезки, чтобы помочь вам определить, как он подходит с прецедентом.

обзор

Магнитуда на основе веса обрезки постепенно обнуляет модель весов в процессе обучения для достижения модели разреженности. Разреженных модель легче компресс, и мы можем пропустить нули во время вывода для латентности улучшений.

Этот метод приносит улучшения через сжатие модели. В будущем, рамки поддержки этого метода обеспечит задержки улучшения. Мы видели до 6х улучшения сжатия модели с минимальной потерей точности.

Методика оценивается в различных речевых приложений, таких как распознавание речи и текста в речь, и Проводились эксперименты по всему различным видением и перевода моделей.

API Матрица совместимости

Пользователи могут применять обрезку со следующим API:

  • Модель здание: tf.keras только с Sequential и функциональными моделями
  • TensorFlow версии: 1.x TF для версии 1.14+ и 2.x.
    • tf.compat.v1 с пакетом 2.X TF и tf.compat.v2 с пакетом 1.X TF не поддерживаются.
  • режим выполнения TensorFlow: как график и нетерпеливый
  • Распределенная обучение: tf.distribute только выполнение графика

Именно на нашей дорожной карте, чтобы добавить поддержку в следующих областях:

Полученные результаты

изображение Классификация

Модель Неразреженные Top-1 Точность разреженная Точность разреженность
InceptionV3 78,1% 78,0% 50%
76,1% 75%
74,6% 87,5%
MobilenetV1 224 71,04% 70,84% 50%

Модели были протестированы на Imagenet.

Перевод

Модель Неразреженный BLEU разреженный BLEU разреженность
GNMT RU-DE 26,77 26,86 80%
26,52 85%
26,19 90%
GNMT ДЕ-RU 29,47 29,50 80%
29,24 85%
28,81 90%

Модели используют WMT16 немецкие и английский набор данные с газетным test2013 как множество Дева и газетным test2015 в качестве тестового набора.

Примеры

В дополнение к Чернослив с Keras учебника приведены в следующих примерах:

  • Поезд модели CNN на рукописной значной задаче классификации MNIST с обрезком: код
  • Поезд LSTM на IMDB настроения задачи классификации с обрезке: код

Для фона, см обрезать или не чернослив: изучение эффективности обрезки для модели сжатия [ бумаги ].