简单易懂Pytorch实战实例VGG深度网络

2023-08-16 14:23:04 332

模型VGG，数据集cifar。对照这份代码走一遍，大概就知道整个pytorch的运行机制。

来源

定义模型：

'''VGG11/13/16/19inPytorch.'''
importtorch
importtorch.nnasnn
fromtorch.autogradimportVariable


cfg={
'VGG11':[64,'M',128,'M',256,256,'M',512,512,'M',512,512,'M'],
'VGG13':[64,64,'M',128,128,'M',256,256,'M',512,512,'M',512,512,'M'],
'VGG16':[64,64,'M',128,128,'M',256,256,256,'M',512,512,512,'M',512,512,512,'M'],
'VGG19':[64,64,'M',128,128,'M',256,256,256,256,'M',512,512,512,512,'M',512,512,512,512,'M'],
}

#模型需继承nn.Module
classVGG(nn.Module):
#初始化参数：
def__init__(self,vgg_name):
super(VGG,self).__init__()
self.features=self._make_layers(cfg[vgg_name])
self.classifier=nn.Linear(512,10)

#模型计算时的前向过程，也就是按照这个过程进行计算
defforward(self,x):
out=self.features(x)
out=out.view(out.size(0),-1)
out=self.classifier(out)
returnout

def_make_layers(self,cfg):
layers=[]
in_channels=3
forxincfg:
ifx=='M':
layers+=[nn.MaxPool2d(kernel_size=2,stride=2)]
else:
layers+=[nn.Conv2d(in_channels,x,kernel_size=3,padding=1),
nn.BatchNorm2d(x),
nn.ReLU(inplace=True)]
in_channels=x
layers+=[nn.AvgPool2d(kernel_size=1,stride=1)]
returnnn.Sequential(*layers)

#net=VGG('VGG11')
#x=torch.randn(2,3,32,32)
#print(net(Variable(x)).size())

定义训练过程：

'''TrainCIFAR10withPyTorch.'''
from__future__importprint_function

importtorch
importtorch.nnasnn
importtorch.optimasoptim
importtorch.nn.functionalasF
importtorch.backends.cudnnascudnn

importtorchvision
importtorchvision.transformsastransforms

importos
importargparse

frommodelsimport*
fromutilsimportprogress_bar
fromtorch.autogradimportVariable

#获取参数
parser=argparse.ArgumentParser(description='PyTorchCIFAR10Training')
parser.add_argument('--lr',default=0.1,type=float,help='learningrate')
parser.add_argument('--resume','-r',action='store_true',help='resumefromcheckpoint')
args=parser.parse_args()

use_cuda=torch.cuda.is_available()
best_acc=0#besttestaccuracy
start_epoch=0#startfromepoch0orlastcheckpointepoch

#获取数据集，并先进行预处理
print('==>Preparingdata..')
#图像预处理和增强
transform_train=transforms.Compose([
transforms.RandomCrop(32,padding=4),
transforms.RandomHorizontalFlip(),
transforms.ToTensor(),
transforms.Normalize((0.4914,0.4822,0.4465),(0.2023,0.1994,0.2010)),
])

transform_test=transforms.Compose([
transforms.ToTensor(),
transforms.Normalize((0.4914,0.4822,0.4465),(0.2023,0.1994,0.2010)),
])

trainset=torchvision.datasets.CIFAR10(root='./data',train=True,download=True,transform=transform_train)
trainloader=torch.utils.data.DataLoader(trainset,batch_size=128,shuffle=True,num_workers=2)

testset=torchvision.datasets.CIFAR10(root='./data',train=False,download=True,transform=transform_test)
testloader=torch.utils.data.DataLoader(testset,batch_size=100,shuffle=False,num_workers=2)

classes=('plane','car','bird','cat','deer','dog','frog','horse','ship','truck')

#继续训练模型或新建一个模型
ifargs.resume:
#Loadcheckpoint.
print('==>Resumingfromcheckpoint..')
assertos.path.isdir('checkpoint'),'Error:nocheckpointdirectoryfound!'
checkpoint=torch.load('./checkpoint/ckpt.t7')
net=checkpoint['net']
best_acc=checkpoint['acc']
start_epoch=checkpoint['epoch']
else:
print('==>Buildingmodel..')
net=VGG('VGG16')
#net=ResNet18()
#net=PreActResNet18()
#net=GoogLeNet()
#net=DenseNet121()
#net=ResNeXt29_2x64d()
#net=MobileNet()
#net=MobileNetV2()
#net=DPN92()
#net=ShuffleNetG2()
#net=SENet18()

#如果GPU可用，使用GPU
ifuse_cuda:
#moveparamandbuffertoGPU
net.cuda()
#paralleluseGPU
net=torch.nn.DataParallel(net,device_ids=range(torch.cuda.device_count()-1))
#speedupslightly
cudnn.benchmark=True


#定义度量和优化
criterion=nn.CrossEntropyLoss()
optimizer=optim.SGD(net.parameters(),lr=args.lr,momentum=0.9,weight_decay=5e-4)

#训练阶段
deftrain(epoch):
print('\nEpoch:%d'%epoch)
#switchtotrainmode
net.train()
train_loss=0
correct=0
total=0
#batch数据
forbatch_idx,(inputs,targets)inenumerate(trainloader):
#将数据移到GPU上
ifuse_cuda:
inputs,targets=inputs.cuda(),targets.cuda()
#先将optimizer梯度先置为0
optimizer.zero_grad()
#Variable表示该变量属于计算图的一部分，此处是图计算的开始处。图的leafvariable
inputs,targets=Variable(inputs),Variable(targets)
#模型输出
outputs=net(inputs)
#计算loss，图的终点处
loss=criterion(outputs,targets)
#反向传播，计算梯度
loss.backward()
#更新参数
optimizer.step()
#注意如果你想统计loss，切勿直接使用loss相加，而是使用loss.data[0]。因为loss是计算图的一部分，如果你直接加loss，代表totalloss同样属于模型一部分，那么图就越来越大
train_loss+=loss.data[0]
#数据统计
_,predicted=torch.max(outputs.data,1)
total+=targets.size(0)
correct+=predicted.eq(targets.data).cpu().sum()

progress_bar(batch_idx,len(trainloader),'Loss:%.3f|Acc:%.3f%%(%d/%d)'
%(train_loss/(batch_idx+1),100.*correct/total,correct,total))

#测试阶段
deftest(epoch):
globalbest_acc
#先切到测试模型
net.eval()
test_loss=0
correct=0
total=0
forbatch_idx,(inputs,targets)inenumerate(testloader):
ifuse_cuda:
inputs,targets=inputs.cuda(),targets.cuda()
inputs,targets=Variable(inputs,volatile=True),Variable(targets)
outputs=net(inputs)
loss=criterion(outputs,targets)
#lossisvariable,ifaddit(+=loss)directly,therewillbeabiggerangbiggergraph.
test_loss+=loss.data[0]
_,predicted=torch.max(outputs.data,1)
total+=targets.size(0)
correct+=predicted.eq(targets.data).cpu().sum()

progress_bar(batch_idx,len(testloader),'Loss:%.3f|Acc:%.3f%%(%d/%d)'
%(test_loss/(batch_idx+1),100.*correct/total,correct,total))

#Savecheckpoint.
#保存模型
acc=100.*correct/total
ifacc>best_acc:
print('Saving..')
state={
'net':net.moduleifuse_cudaelsenet,
'acc':acc,
'epoch':epoch,
}
ifnotos.path.isdir('checkpoint'):
os.mkdir('checkpoint')
torch.save(state,'./checkpoint/ckpt.t7')
best_acc=acc

#运行模型
forepochinrange(start_epoch,start_epoch+200):
train(epoch)
test(epoch)
#清除部分无用变量
torch.cuda.empty_cache()

运行：

新模型：
pythonmain.py--lr=0.01
旧模型继续训练：
pythonmain.py--resume--lr=0.01

一些utility：

'''SomehelperfunctionsforPyTorch,including:
-get_mean_and_std:calculatethemeanandstdvalueofdataset.
-msr_init:netparameterinitialization.
-progress_bar:progressbarmimicxlua.progress.
'''
importos
importsys
importtime
importmath

importtorch.nnasnn
importtorch.nn.initasinit


defget_mean_and_std(dataset):
'''Computethemeanandstdvalueofdataset.'''
dataloader=torch.utils.data.DataLoader(dataset,batch_size=1,shuffle=True,num_workers=2)
mean=torch.zeros(3)
std=torch.zeros(3)
print('==>Computingmeanandstd..')
forinputs,targetsindataloader:
foriinrange(3):
mean[i]+=inputs[:,i,:,:].mean()
std[i]+=inputs[:,i,:,:].std()
mean.div_(len(dataset))
std.div_(len(dataset))
returnmean,std

definit_params(net):
'''Initlayerparameters.'''
forminnet.modules():
ifisinstance(m,nn.Conv2d):
init.kaiming_normal(m.weight,mode='fan_out')
ifm.bias:
init.constant(m.bias,0)
elifisinstance(m,nn.BatchNorm2d):
init.constant(m.weight,1)
init.constant(m.bias,0)
elifisinstance(m,nn.Linear):
init.normal(m.weight,std=1e-3)
ifm.bias:
init.constant(m.bias,0)


_,term_width=os.popen('sttysize','r').read().split()
term_width=int(term_width)

TOTAL_BAR_LENGTH=65.
last_time=time.time()
begin_time=last_time
defprogress_bar(current,total,msg=None):
globallast_time,begin_time
ifcurrent==0:
begin_time=time.time()#Resetfornewbar.

cur_len=int(TOTAL_BAR_LENGTH*current/total)
rest_len=int(TOTAL_BAR_LENGTH-cur_len)-1

sys.stdout.write('[')
foriinrange(cur_len):
sys.stdout.write('=')
sys.stdout.write('>')
foriinrange(rest_len):
sys.stdout.write('.')
sys.stdout.write(']')

cur_time=time.time()
step_time=cur_time-last_time
last_time=cur_time
tot_time=cur_time-begin_time

L=[]
L.append('Step:%s'%format_time(step_time))
L.append('|Tot:%s'%format_time(tot_time))
ifmsg:
L.append('|'+msg)

msg=''.join(L)
sys.stdout.write(msg)
foriinrange(term_width-int(TOTAL_BAR_LENGTH)-len(msg)-3):
sys.stdout.write('')

#Gobacktothecenterofthebar.
foriinrange(term_width-int(TOTAL_BAR_LENGTH/2)+2):
sys.stdout.write('\b')
sys.stdout.write('%d/%d'%(current+1,total))

ifcurrent0:
f+=str(days)+'D'
i+=1
ifhours>0andi<=2:
f+=str(hours)+'h'
i+=1
ifminutes>0andi<=2:
f+=str(minutes)+'m'
i+=1
ifsecondsf>0andi<=2:
f+=str(secondsf)+'s'
i+=1
ifmillis>0andi<=2:
f+=str(millis)+'ms'
i+=1
iff=='':
f='0ms'
returnf

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持毛票票。

简单易懂Pytorch实战实例VGG深度网络

热门推荐

随机推荐