Pytorch之finetune使用详解

激活笔记 2024-11-24 14:45 62 阅读

finetune分为全局finetune和局部finetune。首先介绍一下局部finetune步骤：

1.固定参数

 for name, child in model.named_children(): for param in child.parameters(): param.requires_grad = False

后，只传入需要反传的参数，否则会报错

 filter(lambda param: param.requires_grad, model.parameters())

2.调低学习率，加快衰减

finetune是在预训练模型上进行微调，学习速率不能太大。

目前不清楚：学习速率降低的幅度可以更快一些。这样以来，在使用step的策略时，stepsize可以更小一些。

直接从原始数据训练的base_lr一般为0.01，微调要比0.01小,置为0.001

要比直接训练的小一些，直接训练的stepsize为，finetune的stepsize: 50000

3. 固定bn或取消dropout：

batchnorm会影响训练的效果，随着每个batch，追踪样本的均值和方差。对于固定的网络，bn应该使用全局的数值

 def freeze_bn(self): for layer in self.modules(): if isinstance(layer, nn.BatchNorm2d): layer.eval()

训练时，model.train()会修改模式，freeze_zn()应该在这里后面

4.过滤参数

训练时，对于优化器，应该只传入需要改变的参数，否则会报错

 filter(lambda p: p.requires_grad, model.parameters())

以上这篇Pytorch之finetune使用详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持本网站。

您可能感兴趣的文章:

pytorch 实现将自己的图片数据处理成可以训练的图片类型
pytorch 准备、训练和测试自己的图片数据的方法
Pytorch自己加载单通道图片用作数据集训练的实例
pytorch finetuning 自己的图片进行训练操作

Pytorch之finetune使用详解

2023年最新react面试题总结大全(附详细答案)

python实现自动更换ip的方法

Python中的for循环示例详解

可爱松鼠微信头像图片

Ghost安装器怎么安装Win10-Ghost安装器下安装Win10专业版系统详细图文教程

VUE3使用JSON编辑器的详细图文教程

iphone X如何关闭后台？苹果iphone X关闭软件后台方法介绍

Uint 和 int 的区别解析

Headshot插件如何使用-Headshot插件使用教程

Filecoin(FIL)是什么币？如何挖掘Filecoin

至强e31230v2处理器怎么样至强e31230v2相当于i几

小程序实现日历打卡功能

IntelliJ IDEA 2020.2.3永久破解激活教程(亲测有效)

ctrl是什么意思？ctrl键的作用大全

梦幻西游元宵节灯谜答案第一弹攻略

WPS新增的11个数组函数怎么用 wps数组函数的使用方法

Android移动应用开发指南之六种布局详解

python中用cantools和can工具包解析blf文件的方法

暗黑3玉魂师套装地下城入口及打法攻略

前端异常502 bad gateway的原因和解决办法

Pytorch之finetune使用详解

2023年最新react面试题总结大全(附详细答案)

python实现自动更换ip的方法

Python中的for循环示例详解

可爱松鼠微信头像图片

Ghost安装器怎么安装Win10-Ghost安装器下安装Win10专业版系统详细图文教程

VUE3使用JSON编辑器的详细图文教程

iphone X如何关闭后台？苹果iphone X关闭软件后台方法介绍

Uint 和 int 的区别解析

Headshot插件如何使用-Headshot插件使用教程

Filecoin(FIL)是什么币？如何挖掘Filecoin

至强e31230v2处理器怎么样 至强e31230v2相当于i几

小程序实现日历打卡功能

IntelliJ IDEA 2020.2.3永久破解激活教程(亲测有效)

ctrl是什么意思？ctrl键的作用大全

梦幻西游元宵节灯谜答案第一弹攻略

WPS新增的11个数组函数怎么用 wps数组函数的使用方法

Android移动应用开发指南之六种布局详解

python中用cantools和can工具包解析blf文件的方法

暗黑3玉魂师套装地下城入口及打法攻略

前端异常502 bad gateway的原因和解决办法

至强e31230v2处理器怎么样至强e31230v2相当于i几