Python对130w+张图片检索的实现方法
任务说明:
130w+张图片,8张excel表里记录了需要检索图片的文件名,现在需要找出对应的图片,将找出的图片按不同的excel分别保存,并且在excel里能够直接打开图片。
任务分析:
如果数据量不大的话,可以直接读取excel表里的文件名进行搜索保存,但这次的任务显然不合适,因为图片实在太多,所以考虑后按照以下步骤:
1、遍历图片文件夹,读取文件名和文件路径,写入到csv文件中;
2、使用pandas的merge函数,实现8张原始excel表与csv文件根据图片文件名的对碰;
3、使用shutil的copy函数,读取文件路径进行保存。
代码分析:
1、文件遍历
importos
importpandasaspd
file_list=[]
path_list=[]
path=r"此处添加图片路径"
print("任务开始")
forroot,dirs,filesinos.walk(path):
forfileinfiles:
file_list.append(file.split('.')[0])
path_list.append(os.path.join(root,file))
print("文件遍历结束")
file_dic=dict(zip(file_list,path_list))
df=pd.DataFrame.from_dict(file_dic,orient='index',columns=['图片1路径']).reset_index().rename(columns={'index':'图片1'})
df.to_csv("图片1.csv")
df=pd.DataFrame.from_dict(file_dic,orient='index',columns=['图片2路径']).reset_index().rename(columns={'index':'图片2'})
df.to_csv("图片2.csv")
df=pd.DataFrame.from_dict(file_dic,orient='index',columns=['图片3路径']).reset_index().rename(columns={'index':'图片3'})
df.to_csv("图片3.csv")
print("文件目录导出成功")
2、表格对碰
importpandasaspd
frame1=pd.read_excel(r'excel表1.xlsx','sheet名')
frame2=pd.read_csv(r'图片1.csv',sep=',')
frame3=pd.read_csv(r'图片2.csv',sep=',')
frame4=pd.read_csv(r'图片3.csv',sep=',')
frame5=pd.merge(frame1,frame2,on=['图片1'],how='left')
frame6=pd.merge(frame5,frame3,on=['图片2'],how='left')
frame7=pd.merge(frame6,frame4,on=['图片3'],how='left')
col=['图片1','图片2','图片3']
frame7[col]=frame7[col].fillna('未找到')
frame7.to_excel('excel表1合并后.xlsx')
3、图片复制
importshutil
target='此处为excel表1导出图片路径'
copylist1=frame7['图片1']
forsrcincopylist1:
ifsrc!='未找到':
shutil.copy(src,target)
copylist2=frame7['图片2']
forsrcincopylist2:
ifsrc!='未找到':
shutil.copy(src,target)
copylist3=frame7['图片3']
forsrcincopylist3:
ifsrc!='未找到':
shutil.copy(src,target)
print('复制完毕')
4、excel里打开图片,可以使用excel自带的hyperlink函数。
总结
到此这篇关于Python对130w+张图片检索实现的文章就介绍到这了,更多相关Python图片检索内容请搜索毛票票以前的文章或继续浏览下面的相关文章希望大家以后多多支持毛票票!
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。