将数据集制作成VOC数据集格式的实例

2023-08-01 03:23:03 411

在做目标检测任务时，若使用Github已复现的论文时，需首先将自己的数据集转化为VOC数据集的格式，因为论文作者使用的是公开数据集VOC2007、VOC2012、COCO等类型数据集做方法验证与比对。

一、VOC数据集格式

--VOCdevkit2007

--VOC2007

--Annotations(xml格式的文件)

--000001.xml

--ImageSets

--Layout

--Main

--train.txt

--test.txt

--val.txt

--trainval.txt

--Segmentation

--JPEGImages(训练集和测试集图片)

--000001.jpg

--results

二、转换过程步骤

1.使用标注工具标注图片目标检测框，生成JSON格式的标注文件(本人使用此生成类型的标注工具，也可使用(LabelImg等标注工具)；

2.批量修改图片和标注文件名称，从000001.jpg、000001.json标号开始；

#coding='utf-8'
importos
importnumpyasnp

defimgs_rename(imgs_path):
imgs_labels_name=np.array(os.listdir(imgs_path)).reshape(-1,2)
#从000001开始
i=1
forimg_label_nameinimgs_labels_name:
ifimg_label_name[0].endswith('.jpg'):
#修改图片名称
img_old_name=os.path.join(os.path.abspath(imgs_path),img_label_name[0])
#类别+图片编号format(str(i),'0>3s')填充对齐
img_new_name=os.path.join(os.path.abspath(imgs_path),'00'+format(str(i),'0>4s')+'.jpg')
os.rename(img_old_name,img_new_name)
#修改json文件名称
label_old_name=os.path.join(os.path.abspath(imgs_path),img_label_name[1])
label_new_name=os.path.join(os.path.abspath(imgs_path),'00'+format(str(i),'0>4s')+'.json')
os.rename(label_old_name,label_new_name)
i=i+1

if__name__=='__main__':
#读取json文件的路径
root="read_file_path"

imgs_rename(root)

3.提取图片和标注文件到不同文件夹下，并将读取的标注框转化为txt文件格式(本人的图片和JSON文件在同一目录下生成)；

importjson
importos
importnumpyasnp
importcv2

#读取json格式文件，返回坐标
defread_json(file_name):
file=open(file_name,'r',encoding='utf-8')
set=json.load(file)
#print("读取完整信息：",set)
coord=set['objects'][0]['seg']#只读取第一个标注的车牌
returncoord

defsave_imgs(imgs_jsons_files,imgs_path):
#提取图片文件夹中的jpg文件名称
foridxinrange(len(imgs_jsons_list)):
ifimgs_jsons_list[idx][-3:]=='jpg':
img_name=imgs_jsons_list[idx]
read_img_path=os.path.join(imgs_jsons_files,img_name)
img=cv2.imread(read_img_path)
save_img_path=os.path.join(imgs_path,img_name)
cv2.imwrite(save_img_path,img)

defsave_labels(imgs_jsons_files,labels_path):
#提取图片文件夹中的json文件名称
foridxinrange(len(imgs_jsons_list)):
ifimgs_jsons_list[idx][-4:]=='json':
json_name=imgs_jsons_list[idx]

#操作每一个json文件，读取并保存坐标
json_path=os.path.join(imgs_jsons_files,json_name)
json_coord=read_json(json_path)
iflen(json_coord)>8:
print("标注坐标多于四个点的文件名称：",json_name)

#提取左上和右下坐标
roi_coord=[]
foridxinrange(len(json_coord)):
ifidx==0oridx==1oridx==4oridx==5:
roi_coord.extend([json_coord[idx]])
#保存roi坐标到txt文件中
label_path=labels_path+json_name[:6]+'.txt'
np.savetxt(label_path,roi_coord)

if__name__=='__main__':
print("loading......")
#读取jpgjson文件的路径
imgs_jsons_files="Jpg_json_file_path"

#保存读取的真实标签路径
labels_path="save_labels_path"
ifnotos.path.exists(labels_path):
os.mkdir(labels_path)
#保存读取的图片
imgs_path="sabe_imgs_path"
ifnotos.path.exists(imgs_path):
os.mkdir(imgs_path)

imgs_jsons_list=os.listdir(imgs_jsons_files)

save_imgs(imgs_jsons_files,imgs_path)
save_labels(imgs_jsons_files,labels_path)
print("done!!!")

4.转化标注框txt格式为xml格式；

#encoding=utf-8
importos
importnumpyasnp
importcodecs
importcv2

defread_txt(label_path):
file=open(label_path,'r',encoding='utf-8')
label_lines=file.readlines()
label=[]
forlineinlabel_lines:
one_line=float(line.strip().split('\n')[0])
label.extend([one_line])
returnnp.array(label,dtype=np.float64)

defcovert_xml(label,xml_path,img_name,img_path):
#获得图片信息
img=cv2.imread(img_path)
height,width,depth=img.shape
x_min,y_min,x_max,y_max=label

xml=codecs.open(xml_path,'w',encoding='utf-8')
xml.write('\n')
xml.write('\t'+'VOC2007'+'\n')
xml.write('\t'+img_name+'\n')
xml.write('\t\n')
xml.write('\t\tTheVOC2007Database\n')
xml.write('\t\tPascalVOC2007\n')
xml.write('\t\tflickr\n')
xml.write('\t\tNULL\n')
xml.write('\t\n')
xml.write('\t\n')
xml.write('\t\tNULL\n')
xml.write('\t\tfaster\n')
xml.write('\t\n')
xml.write('\t\n')
xml.write('\t\t'+str(width)+'\n')
xml.write('\t\t'+str(height)+'\n')
xml.write('\t\t'+str(depth)+'\n')
xml.write('\t\n')
xml.write('\t\t0\n')
xml.write('\t\n')
xml.write('')

if__name__=='__main__':
labels_file_path="D:/Code_py/VOC2007/labels/"
imgs_file_path="D:/Code_Py/VOC2007/imgs/"

xmls_file_path="D:/Code_py/VOC2007/xmls/"
ifnotos.path.exists(xmls_file_path):
os.mkdir(xmls_file_path)

labels_name=os.listdir(labels_file_path)
forlabel_nameinlabels_name:
label_path=os.path.join(labels_file_path,label_name)
label=read_txt(label_path)

xml_name=label_name[:6]+'.xml'
xml_path=os.path.join(xmls_file_path,xml_name)

img_name=label_name[:6]+'.jpg'
img_path=os.path.join(imgs_file_path,img_name)

covert_xml(label,xml_path,img_name,img_path)

5.切分数据集为训练集、验证集和测试集，仅保存图片的名称到txt问价下即可；

importos
importnumpyasnp

if__name__=='__main__':
root="save_path"
train=open(root+"train.txt",'w',encoding='utf-8')
train_val=open(root+"trainval.txt",'w',encoding='utf-8')
test=open(root+"test.txt",'w',encoding='utf-8')
val=open(root+"val.txt",'w',encoding='utf-8')

imgs_path=os.path.join(root,"imgs")

imgs_name=os.listdir(imgs_path)

#首先切分训练验证集和测试集
train_val_img_info=[]
forimg_nameinimgs_name:
x=np.random.uniform(0,1)
img_info=str(img_name).strip().split('.')[0]
#随机选取1/2比例的数据为测试集
ifx>0.5:
train_val_img_info.append(img_info)
train_val.writelines(img_info)
else:
test.writelines(img_info+'\n')

#然后切分训练验证集为训练集和验证集
forimg_nameintrain_val_img_info:
x=np.random.uniform(0,1)
ifx>0.5:
train.writelines(img_name+'\n')
else:
val.writelines(img_name+'\n')

以上这篇将数据集制作成VOC数据集格式的实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持毛票票。

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

将数据集制作成VOC数据集格式的实例

热门推荐

随机推荐