浅谈Pytorch torch.optim优化器个性化的使用

2023-07-31 22:28:04 361

一、简化前馈网络LeNet

importtorchast


classLeNet(t.nn.Module):
def__init__(self):
super(LeNet,self).__init__()
self.features=t.nn.Sequential(
t.nn.Conv2d(3,6,5),
t.nn.ReLU(),
t.nn.MaxPool2d(2,2),
t.nn.Conv2d(6,16,5),
t.nn.ReLU(),
t.nn.MaxPool2d(2,2)
)
#由于调整shape并不是一个class层，
#所以在涉及这种操作（非nn.Module操作）需要拆分为多个模型
self.classifiter=t.nn.Sequential(
t.nn.Linear(16*5*5,120),
t.nn.ReLU(),
t.nn.Linear(120,84),
t.nn.ReLU(),
t.nn.Linear(84,10)
)

defforward(self,x):
x=self.features(x)
x=x.view(-1,16*5*5)
x=self.classifiter(x)
returnx

net=LeNet()

二、优化器基本使用方法

建立优化器实例

循环：

清空梯度

向前传播

计算Loss

反向传播

更新参数

fromtorchimportoptim

#通常的step优化过程
optimizer=optim.SGD(params=net.parameters(),lr=1)
optimizer.zero_grad()#net.zero_grad()

input_=t.autograd.Variable(t.randn(1,3,32,32))
output=net(input_)
output.backward(output)

optimizer.step()

三、网络模块参数定制

为不同的子网络参数不同的学习率，finetune常用，使分类器学习率参数更高，学习速度更快（理论上）。

1.经由构建网络时划分好的模组进行学习率设定，

##直接对不同的网络模块制定不同学习率
optimizer=optim.SGD([{'params':net.features.parameters()},#默认lr是1e-5
{'params':net.classifiter.parameters(),'lr':1e-2}],lr=1e-5)

2.以网络层对象为单位进行分组，并设定学习率

##以层为单位，为不同层指定不同的学习率
###提取指定层对象
special_layers=t.nn.ModuleList([net.classifiter[0],net.classifiter[3]])
###获取指定层参数id
special_layers_params=list(map(id,special_layers.parameters()))
print(special_layers_params)
###获取非指定层的参数id
base_params=filter(lambdap:id(p)notinspecial_layers_params,net.parameters())
optimizer=t.optim.SGD([{'params':base_params},
{'params':special_layers.parameters(),'lr':0.01}],lr=0.001)

四、在训练中动态的调整学习率

'''调整学习率'''
#新建optimizer或者修改optimizer.params_groups对应的学习率
##新建optimizer更简单也更推荐，optimizer十分轻量级，所以开销很小
##但是新的优化器会初始化动量等状态信息，这对于使用动量的优化器（momentum参数的sgd）可能会造成收敛中的震荡
###optimizer.param_groups:长度2的list，optimizer.param_groups[0]：长度6的字典
print(optimizer.param_groups[0]['lr'])
old_lr=0.1
optimizer=optim.SGD([{'params':net.features.parameters()},
{'params':net.classifiter.parameters(),'lr':old_lr*0.1}],lr=1e-5)

可以看到optimizer.param_groups结构，[{'params','lr','momentum','dampening','weight_decay','nesterov'},{……}]，集合了优化器的各项参数。

torch.optim的灵活使用

重写sgd优化器

importtorch
fromtorch.optim.optimizerimportOptimizer,required

classSGD(Optimizer):
def__init__(self,params,lr=required,momentum=0,dampening=0,weight_decay1=0,weight_decay2=0,nesterov=False):
defaults=dict(lr=lr,momentum=momentum,dampening=dampening,
weight_decay1=weight_decay1,weight_decay2=weight_decay2,nesterov=nesterov)
ifnesterovand(momentum<=0ordampening!=0):
raiseValueError("Nesterovmomentumrequiresamomentumandzerodampening")
super(SGD,self).__init__(params,defaults)

def__setstate__(self,state):
super(SGD,self).__setstate__(state)
forgroupinself.param_groups:
group.setdefault('nesterov',False)

defstep(self,closure=None):
"""Performsasingleoptimizationstep.Arguments:closure(callable,optional):Aclosurethatreevaluatesthemodelandreturnstheloss."""
loss=None
ifclosureisnotNone:
loss=closure()

forgroupinself.param_groups:
weight_decay1=group['weight_decay1']
weight_decay2=group['weight_decay2']
momentum=group['momentum']
dampening=group['dampening']
nesterov=group['nesterov']

forpingroup['params']:
ifp.gradisNone:
continue
d_p=p.grad.data
ifweight_decay1!=0:
d_p.add_(weight_decay1,torch.sign(p.data))
ifweight_decay2!=0:
d_p.add_(weight_decay2,p.data)
ifmomentum!=0:
param_state=self.state[p]
if'momentum_buffer'notinparam_state:
buf=param_state['momentum_buffer']=torch.zeros_like(p.data)
buf.mul_(momentum).add_(d_p)
else:
buf=param_state['momentum_buffer']
buf.mul_(momentum).add_(1-dampening,d_p)
ifnesterov:
d_p=d_p.add(momentum,buf)
else:
d_p=buf

p.data.add_(-group['lr'],d_p)

returnloss

以上这篇浅谈Pytorchtorch.optim优化器个性化的使用就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持毛票票。

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

浅谈Pytorch torch.optim优化器个性化的使用

热门推荐

随机推荐