Python +Selenium解决图片验证码登录或注册问题(推荐)
1.解决思路
首先要获得这张验证码的图片,但是该图片一般都是用的js写的,不能够通过url进行下载。
解决方案:截图然后根据该图片的定位和长高,使用工具进行裁剪
裁剪完毕之后,使用工具解析该图片。
2.代码实现
2.1裁剪出验证码图片
裁剪图片需要使用Pillow库,进入pip包路径后输入安装命令pipinstallPillow:
之前安装的时候忘记了截图,只能够截一张安装后的图片了╰(:з╰∠)_
安装完成后,代码实现方式如下:
#coding=utf-8 fromseleniumimportwebdriver importtime fromPILimportImage fromselenium.webdriver.support.waitimportWebDriverWait driver=webdriver.Chrome() #进入该网站 driver.get("http://www2.nmec.org.cn/wangbao/nme/sp/root/account/signup.html") #能否在5s内找到验证码元素,能才继续 ifWebDriverWait(driver,5).until(lambdathe_driver:the_driver.find_element_by_id("CaptchaImg"),"查找不到该元素"): #对于一次截屏无法到截到验证码的情况,需要滚动一段距离,然后验证码的y坐标也应该减去这段距离 scroll=500 js="document.documentElement.scrollTop='%s'"%scroll driver.execute_script(js) #截下该网站的图片 driver.get_screenshot_as_file("E:/Python_selenium_advance/Picture/full.png") #获得这个图片元素 img_ele=driver.find_element_by_id("CaptchaImg") #得到该元素左上角的x,y坐标和右下角的x,y坐标 left=img_ele.location.get('x') upper=img_ele.location.get('y')-500 right=left+img_ele.size.get('width') lower=upper+img_ele.size.get('height') #打开之前的截图 img=Image.open("E:/Python_selenium_advance/Picture/full.png") #对截图进行裁剪,裁剪的范围为之前验证的左上角至右下角范围 new_img=img.crop((left,upper,right,lower)) #裁剪完成之后保存到指定路径 new_img.save("E:/Python_selenium_advance/Picture/croped.png") time.sleep(2) driver.quit() else: print("找不到验证码元素")
2.2使用图鉴商用接口来识别验证码
接口介绍网址:http://www.ttshitu.com/docs/python.html#pageTitle
调用该接口直接使用网页上的接口文档就行,代码如下:
importjson importrequests importbase64 fromioimportBytesIO fromPILimportImage fromsysimportversion_info defbase64_api(uname,pwd,softid,img): img=img.convert('RGB') buffered=BytesIO() img.save(buffered,format="JPEG") ifversion_info.major>=3: b64=str(base64.b64encode(buffered.getvalue()),encoding='utf-8') else: b64=str(base64.b64encode(buffered.getvalue())) data={"username":uname,"password":pwd,"softid":softid,"image":b64} result=json.loads(requests.post("http://api.ttshitu.com/base64",json=data).text) ifresult['success']: returnresult["data"]["result"] else: returnresult["message"] return""
将其保存为一个单独的analysis_captcha.py,然后再导入该方法,直接使用即可:
fromanalysis_captchaimportbase64_api defanalysis_captcha(filename): ''' 使用图鉴商用接口来识别指定位置的验证码图片 :paramfilename:验证码图片位置 :return:验证码文本 ''' img_path=filename img=Image.open(img_path) result=base64_api(uname='kaibin',pwd='******',softid='4545454',img=img) returnresult
验证码识别可能会出错,到时候再点击验证码图片换一张,然后重来即可。
总结
以上所述是小编给大家介绍的Python+Selenium实现图片验证码登录或注册问题,希望对大家有所帮助!
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。