python将中文数字转化成阿拉伯数字的简单方法
正则表达式提取文本中的数字
这里演示一下文本中提取中文年份
importre m0="在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立" pattrern1='[零一二三四五六七八九]{4,}' pattrern2='[〇一二三四五六七八九零壹贰叁肆伍陆柒捌玖貮两]{4,}' time1=re.findall(pattrern1,m0)#转化数字
提取年份如:‘1949',‘1990',‘1996'
这里给出许多正则表达式的样例:example
中文转化成阿拉伯数字
创建一个字典然后讲数字进项匹配:
CN_NUM={ '〇':0,'一':1,'二':2,'三':3,'四':4,'五':5,'六':6,'七':7,'八':8,'九':9,'零':0, '壹':1,'贰':2,'叁':3,'肆':4,'伍':5,'陆':6,'柒':7,'捌':8,'玖':9,'貮':2,'两':2,} foriinrange(len(time1)): new_str='' forjintime1[i]: new_str+=str(CN_NUM[j]) time1[i]=new_str time1
这样结果就出来啦,成功将上文例子中文年份转化成阿拉伯数字:‘1949',‘1990',‘1996'
完整代码
#2、将句子中年份的大写数字改为阿拉伯数字 importre m0="在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立" pattrern1='[零一二三四五六七八九]{4,}' pattrern2='[〇一二三四五六七八九零壹贰叁肆伍陆柒捌玖貮两]{4,}' time1=re.findall(pattrern1,m0)#转化数字 CN_NUM={ '〇':0,'一':1,'二':2,'三':3,'四':4,'五':5,'六':6,'七':7,'八':8,'九':9,'零':0, '壹':1,'贰':2,'叁':3,'肆':4,'伍':5,'陆':6,'柒':7,'捌':8,'玖':9,'貮':2,'两':2,} foriinrange(len(time1)): new_str='' forjintime1[i]: new_str+=str(CN_NUM[j]) time1[i]=new_str time1
总结
到此这篇关于python将中文数字转化成阿拉伯数字的文章就介绍到这了,更多相关python中文数字转阿拉伯数字内容请搜索毛票票以前的文章或继续浏览下面的相关文章希望大家以后多多支持毛票票!
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。