python实现提取COCO,VOC数据集中特定的类

2023-07-29 12:56:04 498

1.python提取COCO数据集中特定的类

安装pycocotoolsgithub地址：https://github.com/philferriere/cocoapi

pipinstallgit+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI

提取特定的类别如下：

frompycocotools.cocoimportCOCO
importos
importshutil
fromtqdmimporttqdm
importskimage.ioasio
importmatplotlib.pyplotasplt
importcv2
fromPILimportImage,ImageDraw

#thepathyouwanttosaveyourresultsforcocotovoc
savepath="/media/huanglong/Newsmy/COCO/"#保存提取类的路径,我放在同一路径下
img_dir=savepath+'images/'
anno_dir=savepath+'Annotations/'
#datasets_list=['train2014','val2014']
datasets_list=['train2014']

classes_names=['person']#coco有80类，这里写要提取类的名字，以person为例
#Storeannotationsandtrain2014/val2014/...inthisfolder
dataDir='/media/huanglong/Newsmy/COCO/'#原coco数据集

headstr="""\

VOC
%s

MyDatabase
COCO
flickr
NULL


NULL
company


%d
%d
%d

0
"""
objstr="""\

"""

tailstr='''\

'''

#ifthedirisnotexists,makeit,elsedeleteit
defmkr(path):
ifos.path.exists(path):
shutil.rmtree(path)
os.mkdir(path)
else:
os.mkdir(path)
mkr(img_dir)
mkr(anno_dir)
defid2name(coco):
classes=dict()
forclsincoco.dataset['categories']:
classes[cls['id']]=cls['name']
returnclasses

defwrite_xml(anno_path,head,objs,tail):
f=open(anno_path,"w")
f.write(head)
forobjinobjs:
f.write(objstr%(obj[0],obj[1],obj[2],obj[3],obj[4]))
f.write(tail)


defsave_annotations_and_imgs(coco,dataset,filename,objs):
#eg:COCO_train2014_000000196610.jpg-->COCO_train2014_000000196610.xml
anno_path=anno_dir+filename[:-3]+'xml'
img_path=dataDir+dataset+'/'+filename
print(img_path)
dst_imgpath=img_dir+filename

img=cv2.imread(img_path)
#if(img.shape[2]==1):
#print(filename+"notaRGBimage")
#return
shutil.copy(img_path,dst_imgpath)

head=headstr%(filename,img.shape[1],img.shape[0],img.shape[2])
tail=tailstr
write_xml(anno_path,head,objs,tail)


defshowimg(coco,dataset,img,classes,cls_id,show=True):
globaldataDir
I=Image.open('%s/%s/%s'%(dataDir,dataset,img['file_name']))
#通过id，得到注释的信息
annIds=coco.getAnnIds(imgIds=img['id'],catIds=cls_id,iscrowd=None)
#print(annIds)
anns=coco.loadAnns(annIds)
#print(anns)
#coco.showAnns(anns)
objs=[]
foranninanns:
class_name=classes[ann['category_id']]
ifclass_nameinclasses_names:
print(class_name)
if'bbox'inann:
bbox=ann['bbox']
xmin=int(bbox[0])
ymin=int(bbox[1])
xmax=int(bbox[2]+bbox[0])
ymax=int(bbox[3]+bbox[1])
obj=[class_name,xmin,ymin,xmax,ymax]
objs.append(obj)
draw=ImageDraw.Draw(I)
draw.rectangle([xmin,ymin,xmax,ymax])
ifshow:
plt.figure()
plt.axis('off')
plt.imshow(I)
plt.show()

returnobjs

fordatasetindatasets_list:
#./COCO/annotations/instances_train2014.json
annFile='{}/annotations/instances_{}.json'.format(dataDir,dataset)

#COCOAPIforinitializingannotateddata
coco=COCO(annFile)

#showallclassesincoco
classes=id2name(coco)
print(classes)
#[1,2,3,4,6,8]
classes_ids=coco.getCatIds(catNms=classes_names)
print(classes_ids)
forclsinclasses_names:
#GetIDnumberofthisclass
cls_id=coco.getCatIds(catNms=[cls])
img_ids=coco.getImgIds(catIds=cls_id)
print(cls,len(img_ids))
#imgIds=img_ids[0:10]
forimgIdintqdm(img_ids):
img=coco.loadImgs(imgId)[0]
filename=img['file_name']
#print(filename)
objs=showimg(coco,dataset,img,classes,classes_ids,show=False)
print(objs)
save_annotations_and_imgs(coco,dataset,filename,objs)

2.将上一步提取的COCO某一类xml转为COCO标准的json文件：

#-*-coding:utf-8-*-
#@Time:2019/8/2710：48
#@Author:Rock
#@File:voc2coco.py
#justforobjectdetection
importxml.etree.ElementTreeasET
importos
importjson

coco=dict()
coco['images']=[]
coco['type']='instances'
coco['annotations']=[]
coco['categories']=[]

category_set=dict()
image_set=set()

category_item_id=0
image_id=0
annotation_id=0


defaddCatItem(name):
globalcategory_item_id
category_item=dict()
category_item['supercategory']='none'
category_item_id+=1
category_item['id']=category_item_id
category_item['name']=name
coco['categories'].append(category_item)
category_set[name]=category_item_id
returncategory_item_id


defaddImgItem(file_name,size):
globalimage_id
iffile_nameisNone:
raiseException('Couldnotfindfilenametaginxmlfile.')
ifsize['width']isNone:
raiseException('Couldnotfindwidthtaginxmlfile.')
ifsize['height']isNone:
raiseException('Couldnotfindheighttaginxmlfile.')
img_id="%04d"%image_id
image_id+=1
image_item=dict()
image_item['id']=int(img_id)
#image_item['id']=image_id
image_item['file_name']=file_name
image_item['width']=size['width']
image_item['height']=size['height']
coco['images'].append(image_item)
image_set.add(file_name)
returnimage_id


defaddAnnoItem(object_name,image_id,category_id,bbox):
globalannotation_id
annotation_item=dict()
annotation_item['segmentation']=[]
seg=[]
#bbox[]isx,y,w,h
#left_top
seg.append(bbox[0])
seg.append(bbox[1])
#left_bottom
seg.append(bbox[0])
seg.append(bbox[1]+bbox[3])
#right_bottom
seg.append(bbox[0]+bbox[2])
seg.append(bbox[1]+bbox[3])
#right_top
seg.append(bbox[0]+bbox[2])
seg.append(bbox[1])

annotation_item['segmentation'].append(seg)

annotation_item['area']=bbox[2]*bbox[3]
annotation_item['iscrowd']=0
annotation_item['ignore']=0
annotation_item['image_id']=image_id
annotation_item['bbox']=bbox
annotation_item['category_id']=category_id
annotation_id+=1
annotation_item['id']=annotation_id
coco['annotations'].append(annotation_item)


defparseXmlFiles(xml_path):
forfinos.listdir(xml_path):
ifnotf.endswith('.xml'):
continue

bndbox=dict()
size=dict()
current_image_id=None
current_category_id=None
file_name=None
size['width']=None
size['height']=None
size['depth']=None

xml_file=os.path.join(xml_path,f)
#print(xml_file)

tree=ET.parse(xml_file)
root=tree.getroot()
ifroot.tag!='annotation':
raiseException('pascalvocxmlrootelementshouldbeannotation,ratherthan{}'.format(root.tag))

#elemis,,,

python实现提取COCO,VOC数据集中特定的类

热门推荐

随机推荐