3.1 预训练模型原理

在深度学习的实际应用中,很少会从头开始去训练一个学习网络,尤其是在没有大量数据的时候。即便拥有大量数据,从头开始训练一个网络也很耗时。因为在大数据集上所构建的网络通常模型参数量很大,训练成本也高,所以在构建深度学习应用时,通常会使用预训练模型。要了解预训练模型的原理,首先需要理解 PyTorch 是如何保存和加载模型的,下面介绍状态字典。