Python中的字符串查找操作方法总结
基本的字符串位置查找方法
Python查找字符串使用变量.find("要查找的内容"[,开始位置,结束位置]),开始位置和结束位置,表示要查找的范围,为空则表示查找所有。查找到后会返回位置,位置从0开始算,如果每找到则返回-1。
str='a,hello' printstr.find('hello')#在字符串str里查找字符串hello >>2#输出结果
朴素匹配算法
朴素匹配算法是对目标字符串和模板字符串的一一匹配。如果匹配得上,下标向右移一位,否则清空并重新开始匹配。
target='abbaba' pattern='aba' defmatch(target,pattern): i=j=0 n,m=len(target),len(pattern) whilei<nandj<m: #如果字符相等则目标和模板的下标都向右移 iftarget[i]==pattern[j]: i,j=i+1,j+1 else: #如果字符不相等则目标下标切换到不相等的下标 #模板下标移动到初始下标 i=i-j+1 j=0 ifj==m: returni-j return-1
把上面的加上print后打印一遍
#修改的地方 else: i=i-j+1 j=0 print(target[i],pattern[j],i,j) #打印结果 ba10 ba20 a30 aa40
循环会一直到相等的匹配值,这个方法效率低下,主要是在不匹配时会重新把模板字符循环一次。最多可能会出现m*(n-m+1)次。m是模板字符的长度,n-m+1是排除不等字符的次数。
KMP算法
kmp是通过已知匹配的字符进行移位的算法,比如上面的abb中跟abc比较的话ab是已知的。
defmatch(target,pattern): i=j=0 n,m=len(target),len(pattern) whilei<nandj<m: #如果字符相等则目标和模板的下标都向右移 ififj==-1andtarget[i]==pattern[j]: i,j=i+1,j+1 else: #这里通过next函数来判断位移个数 i=i-j+pattern_next(pattern[:j]) j=0 ifj==m: returni-j return-1 defpattern_next(s): prefix=[s[:i+1]foriinrange(len(s)-1)] suffix=[s[i+1:]foriinrange(len(s)-1)] l=list(set(prefix)&set(suffix)) returnlen(l)