pytorch 准备、训练和测试自己的图片数据的方法

2023-08-03 07:33:04 254

大部分的pytorch入门教程，都是使用torchvision里面的数据进行训练和测试。如果我们是自己的图片数据，又该怎么做呢？

一、我的数据

我在学习的时候，使用的是fashion-mnist。这个数据比较小，我的电脑没有GPU，还能吃得消。关于fashion-mnist数据，可以百度，也可以点此了解一下，数据就像这个样子：

下载地址：https://github.com/zalandoresearch/fashion-mnist

但是下载下来是一种二进制文件，并不是图片，因此我先转换成了图片。

我先解压gz文件到e:/fashion_mnist/文件夹

然后运行代码：

importos
fromskimageimportio
importtorchvision.datasets.mnistasmnist

root="E:/fashion_mnist/"
train_set=(
mnist.read_image_file(os.path.join(root,'train-images-idx3-ubyte')),
mnist.read_label_file(os.path.join(root,'train-labels-idx1-ubyte'))
)
test_set=(
mnist.read_image_file(os.path.join(root,'t10k-images-idx3-ubyte')),
mnist.read_label_file(os.path.join(root,'t10k-labels-idx1-ubyte'))
)
print("trainingset:",train_set[0].size())
print("testset:",test_set[0].size())

defconvert_to_img(train=True):
if(train):
f=open(root+'train.txt','w')
data_path=root+'/train/'
if(notos.path.exists(data_path)):
os.makedirs(data_path)
fori,(img,label)inenumerate(zip(train_set[0],train_set[1])):
img_path=data_path+str(i)+'.jpg'
io.imsave(img_path,img.numpy())
f.write(img_path+''+str(label)+'\n')
f.close()
else:
f=open(root+'test.txt','w')
data_path=root+'/test/'
if(notos.path.exists(data_path)):
os.makedirs(data_path)
fori,(img,label)inenumerate(zip(test_set[0],test_set[1])):
img_path=data_path+str(i)+'.jpg'
io.imsave(img_path,img.numpy())
f.write(img_path+''+str(label)+'\n')
f.close()

convert_to_img(True)
convert_to_img(False)

这样就会在e:/fashion_mnist/目录下分别生成train和test文件夹，用于存放图片。还在该目录下生成了标签文件train.txt和test.txt.

二、进行CNN分类训练和测试

先要将图片读取出来，准备成torch专用的dataset格式，再通过Dataloader进行分批次训练。

代码如下：

importtorch
fromtorch.autogradimportVariable
fromtorchvisionimporttransforms
fromtorch.utils.dataimportDataset,DataLoader
fromPILimportImage
root="E:/fashion_mnist/"

#-----------------readythedataset--------------------------
defdefault_loader(path):
returnImage.open(path).convert('RGB')
classMyDataset(Dataset):
def__init__(self,txt,transform=None,target_transform=None,loader=default_loader):
fh=open(txt,'r')
imgs=[]
forlineinfh:
line=line.strip('\n')
line=line.rstrip()
words=line.split()
imgs.append((words[0],int(words[1])))
self.imgs=imgs
self.transform=transform
self.target_transform=target_transform
self.loader=loader

def__getitem__(self,index):
fn,label=self.imgs[index]
img=self.loader(fn)
ifself.transformisnotNone:
img=self.transform(img)
returnimg,label

def__len__(self):
returnlen(self.imgs)

train_data=MyDataset(txt=root+'train.txt',transform=transforms.ToTensor())
test_data=MyDataset(txt=root+'test.txt',transform=transforms.ToTensor())
train_loader=DataLoader(dataset=train_data,batch_size=64,shuffle=True)
test_loader=DataLoader(dataset=test_data,batch_size=64)


#-----------------createtheNetandtraining------------------------

classNet(torch.nn.Module):
def__init__(self):
super(Net,self).__init__()
self.conv1=torch.nn.Sequential(
torch.nn.Conv2d(3,32,3,1,1),
torch.nn.ReLU(),
torch.nn.MaxPool2d(2))
self.conv2=torch.nn.Sequential(
torch.nn.Conv2d(32,64,3,1,1),
torch.nn.ReLU(),
torch.nn.MaxPool2d(2)
)
self.conv3=torch.nn.Sequential(
torch.nn.Conv2d(64,64,3,1,1),
torch.nn.ReLU(),
torch.nn.MaxPool2d(2)
)
self.dense=torch.nn.Sequential(
torch.nn.Linear(64*3*3,128),
torch.nn.ReLU(),
torch.nn.Linear(128,10)
)

defforward(self,x):
conv1_out=self.conv1(x)
conv2_out=self.conv2(conv1_out)
conv3_out=self.conv3(conv2_out)
res=conv3_out.view(conv3_out.size(0),-1)
out=self.dense(res)
returnout


model=Net()
print(model)

optimizer=torch.optim.Adam(model.parameters())
loss_func=torch.nn.CrossEntropyLoss()

forepochinrange(10):
print('epoch{}'.format(epoch+1))
#training-----------------------------
train_loss=0.
train_acc=0.
forbatch_x,batch_yintrain_loader:
batch_x,batch_y=Variable(batch_x),Variable(batch_y)
out=model(batch_x)
loss=loss_func(out,batch_y)
train_loss+=loss.data[0]
pred=torch.max(out,1)[1]
train_correct=(pred==batch_y).sum()
train_acc+=train_correct.data[0]
optimizer.zero_grad()
loss.backward()
optimizer.step()
print('TrainLoss:{:.6f},Acc:{:.6f}'.format(train_loss/(len(
train_data)),train_acc/(len(train_data))))

#evaluation--------------------------------
model.eval()
eval_loss=0.
eval_acc=0.
forbatch_x,batch_yintest_loader:
batch_x,batch_y=Variable(batch_x,volatile=True),Variable(batch_y,volatile=True)
out=model(batch_x)
loss=loss_func(out,batch_y)
eval_loss+=loss.data[0]
pred=torch.max(out,1)[1]
num_correct=(pred==batch_y).sum()
eval_acc+=num_correct.data[0]
print('TestLoss:{:.6f},Acc:{:.6f}'.format(eval_loss/(len(
test_data)),eval_acc/(len(test_data))))

打印出来的网络模型：

训练和测试结果：

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持毛票票。

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

pytorch 准备、训练和测试自己的图片数据的方法

热门推荐

随机推荐