基于python实现微信好友数据分析(简单)
一、功能介绍
本文主要介绍利用网页端微信获取数据,实现个人微信好友数据的获取,并进行一些简单的数据分析,功能包括:
1.爬取好友列表,显示好友昵称、性别和地域和签名,文件保存为xlsx格式
2.统计好友的地域分布,并且做成词云和可视化展示在地图上
二、依赖库
1、Pyecharts:一个用于生成echarts图表的类库,echarts是百度开源的一个数据可视化库,用echarts生成的图可视化效果非常棒,使用pyechart库可以在python中生成echarts数据图。
2、Itchat:一个开源的微信个人号接口,使用python调用微信从未如此简单。
3、Jieba:简单的分词操作库。
4、Numpy:NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵。
5、Pandas:pandas是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的。
6、Pillow:图像处理。
7、wxpy:wxpy在itchat的基础上,通过大量接口优化提升了模块的易用性,并进行丰富的功能扩展。(微信本身提供)
注:Pyecharts可能安装0.5.*的版本比较好
以上的三方库可以通过命令符(cmd)来实现安装,具体命令:pipinstall***
三,操作
fromwxpyimport*#导入模块 bot=Bot(cache_path=True)#初始化机器人,选择扫码登录 friend_all=bot.friends()#获取微信好友信息
首先出现的是一张二维码,然后扫描登录
成功登录好了就是这种显示
之后就可以进行操作了,好友数量,个人信息
print(len(friend_all))#好友的数量 print(friend_all[0].raw)#输出个人信息
显示的结果
四、接下来把全部的好友信息转化为一个xlsx文件
获取全部好友信息
fora_friendinfriend_all:
NickName=a_friend.raw.get('NickName',None)
#昵称
#Sex=a_friend.raw.get('Sex',None)
Sex={1:"男",2:"女",0:"其它"}.get(a_friend.raw.get('Sex',None),None)
#性别(优化)
City=a_friend.raw.get('City',None)
#城市
Province=a_friend.raw.get('Province',None)
#省份
Signature=a_friend.raw.get('Signature',None)
#个性签名
HeadImgUrl=a_friend.raw.get('HeadImgUrl',None)
#头像地址
HeadImgFlag=a_friend.raw.get('HeadImgFlag',None)
#小Flag
list_0=[NickName,Sex,City,Province,Signature,HeadImgUrl,HeadImgFlag]
#存为一维数组
lis.append(list_0)
#叠加数据
存为xlsx文件
deflist_excel(filename,lis):
'''
将列表写入excel中,其中列表中的元素是列表.
filename:保存的文件名(含路径)
lis:元素为列表的列表,如下:
lis=[["名称","价格","出版社","语言"],
["暗时间","32.4","人民邮电出版社","中文"],
["拆掉思维里的墙","26.7","机械工业出版社","中文"]]
'''
importopenpyxl
wb=openpyxl.Workbook()#激活worksheet
sheet=wb.active
sheet.title='sheet1'#创建一个表格
file_name=filename+'.xlsx'
foriinrange(0,len(lis)):
forjinrange(0,len(lis[i])):
sheet.cell(row=i+1,column=j+1,value=str(lis[i][j]))
#每行每列的存入数据
wb.save(file_name)
print("写入数据成功!")
list_excel('wechat',lis)
效果如下:
可以看到其好友基本分布再广东省,个性签名也是非常的杀马特
五、实现词云图(我们也可以从存储在本地的excel中读取数据进行分析,并查看数据形式。在执行以下代码之前,我们需要先把excel文件加一个列标题行)
例如nicknamesexcityprovincesignatureheadImgUrlheadImgFlag
#导入模块
fromwordcloudimportWordCloud
importmatplotlib.pyplotasplt
importpandasaspd
frompandasimportDataFrame
word_list=df['city'].fillna('0').tolist()
#将dataframe的列转化为list,其中的nan用“0”替换
new_text=''.join(word_list)
wordcloud=WordCloud(font_path='simhei.ttf',background_color="black").generate(new_text)
#设计图背景颜色,字体
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
还可以将词云图存为HTML形式
#利用pyechart做词云
importpandasaspd
#count=df.city.value_counts()#对dataframe进行全频率统计,排除了nan
city_list=df['city'].fillna('NAN').tolist()#将dataframe的列转化为list,其中的nan用“NAN”替换
count_city=pd.value_counts(city_list)#对list进行全频率统计
frompyecharts.charts.wordcloudimportWordCloud#设置对象
name=count_city.index.tolist()
value=count_city.tolist()
wordcloud=WordCloud(width=1300,height=620)
wordcloud.add("",name,value,word_size_range=[20,100])
wordcloud.show_config()
wordcloud.render(r'D:\python\wechatcloud.html')
再看看效果:
六、转化为地图形式
注:安装地图数据包:pipinstallecharts-china-provinces-pypkgpipinstallecharts-countries-pypkg
province_list=df['province'].fillna('NAN').tolist()
#将dataframe的列转化为list,其中的nan用“NAN”替换
count_province=pd.value_counts(province_list)
#对list进行全频率统计
frompyechartsimportMap
value=count_province.tolist()
attr=count_province.index.tolist()
map=Map("各省微信好友分布",width=1300,height=700)
map.add("",attr,value,maptype='china',is_visualmap=True,visual_text_color='#000',is_label_show=True)
#显示地图上的省份
map.show_config()
map.render(r'D:\python\wechatProMap.html')
效果:
总结
以上所述是小编给大家介绍的基于python实现微信好友数据分析,希望对大家有所帮助!
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。