微客导航 » 文章资讯 » python 高效去重复支持GB级别大文件的示例代码

python 高效去重复支持GB级别大文件的示例代码

2023-09-06 00:46:04 424

如下所示：

#coding=utf-8

importsys,re,os

defgetDictList(dict):
regx='''[\w\~`\!\@\#\$\%\^\&\*\(\)\_\-\+\=\[\]\{\}\:\;\,\.\/\<\>\?]+'''
withopen(dict)asf:
data=f.read()
returnre.findall(regx,data)

defrmdp(dictList):
returnlist(set(dictList))

deffileSave(dictRmdp,out):
withopen(out,'a')asf:
forlineindictRmdp:
f.write(line+'\n')

defmain():
try:
dict=sys.argv[1].strip()
out=sys.argv[2].strip()
exceptException,e:
print'error:',e
me=os.path.basename(__file__)
print'usage:%s'%me
print'example:%sdict.txtdict_rmdp.txt'%me
exit()

dictList=getDictList(dict)
dictRmdp=rmdp(dictList)
fileSave(dictRmdp,out)

if__name__=='__main__':
main()

以上这篇python高效去重复支持GB级别大文件的示例代码就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持毛票票。

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

返回顶部
3162201930
czq8825@qq.com

python 高效去重复 支持GB级别大文件的示例代码

热门推荐

随机推荐

python 高效去重复支持GB级别大文件的示例代码