什么是迁移学习

复杂的深度学习模型通常有数百万的参数(weights),从头训练模型需要大量计算资源。迁移学习将已经在相关任务中训练过的模型的一部分复用到新模型中,从而很大程度地降低对大量计算资源的需要。

例如,本节的下一个指南将向你展示如何利用一个的已训练好的模型来构建你自己的图像识别器,此图像识别器能够识别图像中 1000 种不同类型的物体。使用预训练模型的已有知识来识别你的图像,会比原始模型所需的训练数据少得多。

在快速开发新模型时这点很有用,尤其是在浏览器和移动设备这类受限环境下。

通常在实现迁移学习时,我们不调整原始模型的参数,而是删除原始模型的最后一层,并基于此截断模型的输出训练一个新的(通常相当浅的)模型。这就是你将在本节指南中看到的技术。