将数据集制作成VOC数据集格式的实例
在做目标检测任务时,若使用Github已复现的论文时,需首先将自己的数据集转化为VOC数据集的格式,因为论文作者使用的是公开数据集VOC2007、VOC2012、COCO等类型数据集做方法验证与比对。
一、VOC数据集格式
--VOCdevkit2007
--VOC2007
--Annotations(xml格式的文件)
--000001.xml
--ImageSets
--Layout
--Main
--train.txt
--test.txt
--val.txt
--trainval.txt
--Segmentation
--JPEGImages(训练集和测试集图片)
--000001.jpg
--results
二、转换过程步骤
1.使用标注工具标注图片目标检测框,生成JSON格式的标注文件(本人使用此生成类型的标注工具,也可使用(LabelImg等标注工具);
2.批量修改图片和标注文件名称,从000001.jpg、000001.json标号开始;
#coding='utf-8' importos importnumpyasnp defimgs_rename(imgs_path): imgs_labels_name=np.array(os.listdir(imgs_path)).reshape(-1,2) #从000001开始 i=1 forimg_label_nameinimgs_labels_name: ifimg_label_name[0].endswith('.jpg'): #修改图片名称 img_old_name=os.path.join(os.path.abspath(imgs_path),img_label_name[0]) #类别+图片编号format(str(i),'0>3s')填充对齐 img_new_name=os.path.join(os.path.abspath(imgs_path),'00'+format(str(i),'0>4s')+'.jpg') os.rename(img_old_name,img_new_name) #修改json文件名称 label_old_name=os.path.join(os.path.abspath(imgs_path),img_label_name[1]) label_new_name=os.path.join(os.path.abspath(imgs_path),'00'+format(str(i),'0>4s')+'.json') os.rename(label_old_name,label_new_name) i=i+1 if__name__=='__main__': #读取json文件的路径 root="read_file_path" imgs_rename(root)
3.提取图片和标注文件到不同文件夹下,并将读取的标注框转化为txt文件格式(本人的图片和JSON文件在同一目录下生成);
importjson importos importnumpyasnp importcv2 #读取json格式文件,返回坐标 defread_json(file_name): file=open(file_name,'r',encoding='utf-8') set=json.load(file) #print("读取完整信息:",set) coord=set['objects'][0]['seg']#只读取第一个标注的车牌 returncoord defsave_imgs(imgs_jsons_files,imgs_path): #提取图片文件夹中的jpg文件名称 foridxinrange(len(imgs_jsons_list)): ifimgs_jsons_list[idx][-3:]=='jpg': img_name=imgs_jsons_list[idx] read_img_path=os.path.join(imgs_jsons_files,img_name) img=cv2.imread(read_img_path) save_img_path=os.path.join(imgs_path,img_name) cv2.imwrite(save_img_path,img) defsave_labels(imgs_jsons_files,labels_path): #提取图片文件夹中的json文件名称 foridxinrange(len(imgs_jsons_list)): ifimgs_jsons_list[idx][-4:]=='json': json_name=imgs_jsons_list[idx] #操作每一个json文件,读取并保存坐标 json_path=os.path.join(imgs_jsons_files,json_name) json_coord=read_json(json_path) iflen(json_coord)>8: print("标注坐标多于四个点的文件名称:",json_name) #提取左上和右下坐标 roi_coord=[] foridxinrange(len(json_coord)): ifidx==0oridx==1oridx==4oridx==5: roi_coord.extend([json_coord[idx]]) #保存roi坐标到txt文件中 label_path=labels_path+json_name[:6]+'.txt' np.savetxt(label_path,roi_coord) if__name__=='__main__': print("loading......") #读取jpgjson文件的路径 imgs_jsons_files="Jpg_json_file_path" #保存读取的真实标签路径 labels_path="save_labels_path" ifnotos.path.exists(labels_path): os.mkdir(labels_path) #保存读取的图片 imgs_path="sabe_imgs_path" ifnotos.path.exists(imgs_path): os.mkdir(imgs_path) imgs_jsons_list=os.listdir(imgs_jsons_files) save_imgs(imgs_jsons_files,imgs_path) save_labels(imgs_jsons_files,labels_path) print("done!!!")
4.转化标注框txt格式为xml格式;
#encoding=utf-8 importos importnumpyasnp importcodecs importcv2 defread_txt(label_path): file=open(label_path,'r',encoding='utf-8') label_lines=file.readlines() label=[] forlineinlabel_lines: one_line=float(line.strip().split('\n')[0]) label.extend([one_line]) returnnp.array(label,dtype=np.float64) defcovert_xml(label,xml_path,img_name,img_path): #获得图片信息 img=cv2.imread(img_path) height,width,depth=img.shape x_min,y_min,x_max,y_max=label xml=codecs.open(xml_path,'w',encoding='utf-8') xml.write('\n') xml.write('\t ') if__name__=='__main__': labels_file_path="D:/Code_py/VOC2007/labels/" imgs_file_path="D:/Code_Py/VOC2007/imgs/" xmls_file_path="D:/Code_py/VOC2007/xmls/" ifnotos.path.exists(xmls_file_path): os.mkdir(xmls_file_path) labels_name=os.listdir(labels_file_path) forlabel_nameinlabels_name: label_path=os.path.join(labels_file_path,label_name) label=read_txt(label_path) xml_name=label_name[:6]+'.xml' xml_path=os.path.join(xmls_file_path,xml_name) img_name=label_name[:6]+'.jpg' img_path=os.path.join(imgs_file_path,img_name) covert_xml(label,xml_path,img_name,img_path)'+'VOC2007'+' \n') xml.write('\t'+img_name+' \n') xml.write('\t\n') xml.write('\t\n') xml.write('\t\t \n') xml.write('\tNULL \n') xml.write('\t\tfaster \n') xml.write('\t\n') xml.write('\t\t \n') xml.write('\t\t'+str(width)+' \n') xml.write('\t\t'+str(height)+' \n') xml.write('\t\t'+str(depth)+' \n') xml.write('\t0 \n') xml.write('\t\n') xml.write('
5.切分数据集为训练集、验证集和测试集,仅保存图片的名称到txt问价下即可;
importos importnumpyasnp if__name__=='__main__': root="save_path" train=open(root+"train.txt",'w',encoding='utf-8') train_val=open(root+"trainval.txt",'w',encoding='utf-8') test=open(root+"test.txt",'w',encoding='utf-8') val=open(root+"val.txt",'w',encoding='utf-8') imgs_path=os.path.join(root,"imgs") imgs_name=os.listdir(imgs_path) #首先切分训练验证集和测试集 train_val_img_info=[] forimg_nameinimgs_name: x=np.random.uniform(0,1) img_info=str(img_name).strip().split('.')[0] #随机选取1/2比例的数据为测试集 ifx>0.5: train_val_img_info.append(img_info) train_val.writelines(img_info) else: test.writelines(img_info+'\n') #然后切分训练验证集为训练集和验证集 forimg_nameintrain_val_img_info: x=np.random.uniform(0,1) ifx>0.5: train.writelines(img_name+'\n') else: val.writelines(img_name+'\n')
以上这篇将数据集制作成VOC数据集格式的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。