python模拟登陆网站的示例
使用已有cookie登陆
使用浏览器登陆,获取浏览器中的cookie信息,来进行登陆。
我们以博客园为例,先登录博客园账号。我们访问随笔列表,在控制台我们可以看到我们登陆后浏览器的cookie
剔除一些数据统计及分析的cookie,剩下的就是登陆可能需要的.CNBlogsCookie和.Cnblogs.AspNetCore.Cookies
#_gagoogle分析cookie #UM_distinctid友盟cookie #CNZZxxxCNZZcookie #__utma,__utmc,__utmzgoogle统计网站 #Hm_lvt_xxx百度统计网站
importurllib.request url='https://i.cnblogs.com/posts' user_agent='Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/77.0.3865.90Safari/537.36' #浏览器登录后得到的cookie,也就是刚才复制的字符串 cookie_str='.CNBlogsCookie=xxx;.Cnblogs.AspNetCore.Cookies=xxx' headers={ 'User-Agent':user_agent, 'cookie':cookie_str } req=urllib.request.Request(url,headers=headers) resp=urllib.request.urlopen(req).read().decode('utf-8') print(resp)
登陆获取cookie
登陆的表单一般是使用的formdata,现在也有些表单使用requestpayload使用json格式传参。
formdata如药智网
requestpayload如博客园
formdata
博客园的登陆需要拖动验证所以略过。我们以药智网为例,我们打开控制台可以看到登陆需要传的表单参数,这里是使用的formdata表单。我们模拟登陆后获取到登陆后的cookie,然后访问登录后的个人中心页面。
importurllib.request importhttp.cookiejar url='https://www.yaozh.com/login' user_agent='Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/77.0.3865.90Safari/537.36' #formData数据 data={'username':'用户名', 'pwd':'密码', 'formhash':'C3086BBA84', 'backurl':'https%3A%2F%2Fwww.yaozh.com%2F'} post_data=urllib.parse.urlencode(data).encode('utf-8') #请求头设置 headers={ 'User-Agent':user_agent } #构造登陆请求 req=urllib.request.Request(url,headers=headers,data=post_data) #cookie cookie=http.cookiejar.CookieJar() #构造一个opener携带登录后的cookie opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie)) #发送登陆请求 resp=opener.open(req) print(resp) #登录后个人中心 url='https://www.yaozh.com/member/' #构造访问请求 req=urllib.request.Request(url,headers=headers) resp=opener.open(req).read().decode('utf-8') print(resp)
requestpayload
如果登陆需要requestpayload我们需要将参数转为json字符串并在头部设置Content-Type
importjson ... data={'loginType':'1', 'pwdOrVerifyCode':'密码', 'userIdentification':'账号', 'uaToken':'', 'webUmidToken':''} headers={ 'Content-Type':'application/json;charset=UTF-8', 'User-Agent':user_agent } req=urllib.request.Request(url,headers=headers,data=json.dumps(data)) ...
登陆后用session保持登陆状态
我们用requests模块的Session对象来保存回话信息
importrequests url='https://www.yaozh.com/login' user_agent='Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/77.0.3865.90Safari/537.36' #formData数据 data={'username':'chenjy1225', 'pwd':'19931225yjy', 'formhash':'C3086BBA84', 'backurl':'https%3A%2F%2Fwww.yaozh.com%2F'} #构造Session session=requests.Session() #发送post请求 resp=session.post(url,data) #登录后个人中心 url='https://www.yaozh.com/member/' #发送请求访问个人中心 resp=session.get(url).content.decode('utf-8') print(resp)
调用浏览器登陆
我们也可以在程序中调用一个浏览器来访问登陆网站。在python中使用Selenium库就能轻松实现调用浏览器,被控制的浏览器可以是chrome、firefox等。
以前较常用的还是PhantomJS但是PhantomJS被python弃用了。
UserWarning:SeleniumsupportforPhantomJShasbeendeprecated,pleaseuseheadlessversionsofChromeorFirefoxinstead
warnings.warn('SeleniumsupportforPhantomJShasbeendeprecated,pleaseuseheadless'
firefox对应的geckodriver
chrome对应的chrnpm.taobao.org/mirrors/chromedriveromedriver
1.下载Selenium、firefox浏览器及firefox驱动。
2.将下载的firefox驱动geckodriver放在firefox浏览器安装目录
3.将firefox浏览器安装目录添加到path中
4.重启ide
我们找到需要登陆时候输入的元素id及登陆buttonid。
fromseleniumimportwebdriver importtime #新建selenium浏览器对象,后面是geckodriver.exe下载后本地路径 browser=webdriver.Firefox() url='https://www.yaozh.com/login' #浏览器访问登录页面 browser.get(url) #等待3s用于加载脚本文件 browser.implicitly_wait(3) #输入用户名 username=browser.find_element_by_id('username') username.send_keys('chenjy1225') #输入密码 password=browser.find_element_by_id('pwd') password.send_keys('19931225yjy') #点击登录按钮 login_button=browser.find_element_by_id('button') login_button.submit() #网页截图 browser.save_screenshot('screenshot.png') #强制等待5s,等待登录后的跳转 time.sleep(5) url='https://www.yaozh.com/member/' browser.get(url) #网页截图个人中心 browser.save_screenshot('screenshot1.png') #关闭浏览器 browser.quit()
screenshot.png:
screenshot1.png:
以上就是python模拟登陆网站的示例的详细内容,更多关于python模拟登陆网站的资料请关注毛票票其它相关文章!
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。