将数据集制作成VOC数据集格式的实例
在做目标检测任务时,若使用Github已复现的论文时,需首先将自己的数据集转化为VOC数据集的格式,因为论文作者使用的是公开数据集VOC2007、VOC2012、COCO等类型数据集做方法验证与比对。
一、VOC数据集格式
--VOCdevkit2007
--VOC2007
--Annotations(xml格式的文件)
--000001.xml
--ImageSets
--Layout
--Main
--train.txt
--test.txt
--val.txt
--trainval.txt
--Segmentation
--JPEGImages(训练集和测试集图片)
--000001.jpg
--results
二、转换过程步骤
1.使用标注工具标注图片目标检测框,生成JSON格式的标注文件(本人使用此生成类型的标注工具,也可使用(LabelImg等标注工具);
2.批量修改图片和标注文件名称,从000001.jpg、000001.json标号开始;
#coding='utf-8'
importos
importnumpyasnp
defimgs_rename(imgs_path):
imgs_labels_name=np.array(os.listdir(imgs_path)).reshape(-1,2)
#从000001开始
i=1
forimg_label_nameinimgs_labels_name:
ifimg_label_name[0].endswith('.jpg'):
#修改图片名称
img_old_name=os.path.join(os.path.abspath(imgs_path),img_label_name[0])
#类别+图片编号format(str(i),'0>3s')填充对齐
img_new_name=os.path.join(os.path.abspath(imgs_path),'00'+format(str(i),'0>4s')+'.jpg')
os.rename(img_old_name,img_new_name)
#修改json文件名称
label_old_name=os.path.join(os.path.abspath(imgs_path),img_label_name[1])
label_new_name=os.path.join(os.path.abspath(imgs_path),'00'+format(str(i),'0>4s')+'.json')
os.rename(label_old_name,label_new_name)
i=i+1
if__name__=='__main__':
#读取json文件的路径
root="read_file_path"
imgs_rename(root)
3.提取图片和标注文件到不同文件夹下,并将读取的标注框转化为txt文件格式(本人的图片和JSON文件在同一目录下生成);
importjson
importos
importnumpyasnp
importcv2
#读取json格式文件,返回坐标
defread_json(file_name):
file=open(file_name,'r',encoding='utf-8')
set=json.load(file)
#print("读取完整信息:",set)
coord=set['objects'][0]['seg']#只读取第一个标注的车牌
returncoord
defsave_imgs(imgs_jsons_files,imgs_path):
#提取图片文件夹中的jpg文件名称
foridxinrange(len(imgs_jsons_list)):
ifimgs_jsons_list[idx][-3:]=='jpg':
img_name=imgs_jsons_list[idx]
read_img_path=os.path.join(imgs_jsons_files,img_name)
img=cv2.imread(read_img_path)
save_img_path=os.path.join(imgs_path,img_name)
cv2.imwrite(save_img_path,img)
defsave_labels(imgs_jsons_files,labels_path):
#提取图片文件夹中的json文件名称
foridxinrange(len(imgs_jsons_list)):
ifimgs_jsons_list[idx][-4:]=='json':
json_name=imgs_jsons_list[idx]
#操作每一个json文件,读取并保存坐标
json_path=os.path.join(imgs_jsons_files,json_name)
json_coord=read_json(json_path)
iflen(json_coord)>8:
print("标注坐标多于四个点的文件名称:",json_name)
#提取左上和右下坐标
roi_coord=[]
foridxinrange(len(json_coord)):
ifidx==0oridx==1oridx==4oridx==5:
roi_coord.extend([json_coord[idx]])
#保存roi坐标到txt文件中
label_path=labels_path+json_name[:6]+'.txt'
np.savetxt(label_path,roi_coord)
if__name__=='__main__':
print("loading......")
#读取jpgjson文件的路径
imgs_jsons_files="Jpg_json_file_path"
#保存读取的真实标签路径
labels_path="save_labels_path"
ifnotos.path.exists(labels_path):
os.mkdir(labels_path)
#保存读取的图片
imgs_path="sabe_imgs_path"
ifnotos.path.exists(imgs_path):
os.mkdir(imgs_path)
imgs_jsons_list=os.listdir(imgs_jsons_files)
save_imgs(imgs_jsons_files,imgs_path)
save_labels(imgs_jsons_files,labels_path)
print("done!!!")
4.转化标注框txt格式为xml格式;
#encoding=utf-8
importos
importnumpyasnp
importcodecs
importcv2
defread_txt(label_path):
file=open(label_path,'r',encoding='utf-8')
label_lines=file.readlines()
label=[]
forlineinlabel_lines:
one_line=float(line.strip().split('\n')[0])
label.extend([one_line])
returnnp.array(label,dtype=np.float64)
defcovert_xml(label,xml_path,img_name,img_path):
#获得图片信息
img=cv2.imread(img_path)
height,width,depth=img.shape
x_min,y_min,x_max,y_max=label
xml=codecs.open(xml_path,'w',encoding='utf-8')
xml.write('\n')
xml.write('\t'+'VOC2007'+' \n')
xml.write('\t'+img_name+' \n')
xml.write('\t\n')
xml.write('\t\tTheVOC2007Database \n')
xml.write('\t\tPascalVOC2007 \n')
xml.write('\t\tflickr \n')
xml.write('\t\tNULL \n')
xml.write('\t \n')
xml.write('\t\n')
xml.write('\t\tNULL \n')
xml.write('\t\tfaster \n')
xml.write('\t \n')
xml.write('\t\n')
xml.write('\t\t'+str(width)+' \n')
xml.write('\t\t'+str(height)+' \n')
xml.write('\t\t'+str(depth)+' \n')
xml.write('\t \n')
xml.write('\t\t0 \n')
xml.write('\t\n')
xml.write(' ')
if__name__=='__main__':
labels_file_path="D:/Code_py/VOC2007/labels/"
imgs_file_path="D:/Code_Py/VOC2007/imgs/"
xmls_file_path="D:/Code_py/VOC2007/xmls/"
ifnotos.path.exists(xmls_file_path):
os.mkdir(xmls_file_path)
labels_name=os.listdir(labels_file_path)
forlabel_nameinlabels_name:
label_path=os.path.join(labels_file_path,label_name)
label=read_txt(label_path)
xml_name=label_name[:6]+'.xml'
xml_path=os.path.join(xmls_file_path,xml_name)
img_name=label_name[:6]+'.jpg'
img_path=os.path.join(imgs_file_path,img_name)
covert_xml(label,xml_path,img_name,img_path)
5.切分数据集为训练集、验证集和测试集,仅保存图片的名称到txt问价下即可;
importos
importnumpyasnp
if__name__=='__main__':
root="save_path"
train=open(root+"train.txt",'w',encoding='utf-8')
train_val=open(root+"trainval.txt",'w',encoding='utf-8')
test=open(root+"test.txt",'w',encoding='utf-8')
val=open(root+"val.txt",'w',encoding='utf-8')
imgs_path=os.path.join(root,"imgs")
imgs_name=os.listdir(imgs_path)
#首先切分训练验证集和测试集
train_val_img_info=[]
forimg_nameinimgs_name:
x=np.random.uniform(0,1)
img_info=str(img_name).strip().split('.')[0]
#随机选取1/2比例的数据为测试集
ifx>0.5:
train_val_img_info.append(img_info)
train_val.writelines(img_info)
else:
test.writelines(img_info+'\n')
#然后切分训练验证集为训练集和验证集
forimg_nameintrain_val_img_info:
x=np.random.uniform(0,1)
ifx>0.5:
train.writelines(img_name+'\n')
else:
val.writelines(img_name+'\n')
以上这篇将数据集制作成VOC数据集格式的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。