Python实现获取网站PR及百度权重
上一次我用requests库写的一个抓取页面中链接的简单代码,延伸一下,我们还可以利用它来获取我们网站的PR以及百度权重。原理差不多。最后我们甚至可以写一个循环批量查询网站的相关信息。
先说说GooglePR,全称PageRank。它是Google官方给出的评定一个网站SEO的评级,这个大家应该不陌生。既然是官方给出的,当然有一个官方的接口去获取它。我们这里就利用官方的接口获取谷歌PR。
GPR_HASH_SEED="MiningPageRankisAGAINSTGOOGLE'STERMSOFSERVICE.Y\ es,I'mtalkingtoyou,scammer."
defgoogle_hash(value): magic=0x1020345 foriinxrange(len(value)): magic^=ord(GPR_HASH_SEED[i%len(GPR_HASH_SEED)])^ord(value[i]) magic=(magic>>23|magic<<9)&0xFFFFFFFF return"8%08x"%(magic)
defgetPR(www): try: url='http://toolbarqueries.google.com/tbr?'\ 'client=navclient-auto&ch=%s&features=Rank&q=info:%s'%(google_hash(www),www) response=requests.get(url) rex=re.search(r'(.*?:.*?:)(\d+)',response.text) returnrex.group(2) except: returnNone