python基于三阶贝塞尔曲线的数据平滑算法
前言
很多文章在谈及曲线平滑的时候,习惯使用拟合的概念,我认为这是不恰当的。平滑后的曲线,一定经过原始的数据点,而拟合曲线,则不一定要经过原始数据点。
一般而言,需要平滑的数据分为两种:时间序列的单值数据、时间序列的二维数据。对于前者,并非一定要用贝塞尔算法,仅用样条插值就可以轻松实现平滑;而对于后者,不管是numpy还是scipy提供的那些插值算法,就都不适用了。
本文基于三阶贝塞尔曲线,实现了时间序列的单值数据和时间序列的二维数据的平滑算法,可满足大多数的平滑需求。
贝塞尔曲线
关于贝塞尔曲线的数学原理,这里就不讨论了,直接贴出结论:
一阶贝塞尔曲线
二阶贝塞尔曲线
三阶贝塞尔曲线
算法描述
如果我们把三阶贝塞尔曲线的P0和P3视为原始数据,只要找到P1和P2两个点(我们称其为控制点),就可以根据三阶贝塞尔曲线公式,计算出P0和P3之间平滑曲线上的任意点。
现在,平滑问题变成了如何计算两个原始数据点之间的控制点的问题。步骤如下:
第1步:绿色直线连接相邻的原始数据点,计算出个线段的中点,红色直线连接相邻的中点
第2步:根据相邻两条绿色直线长度之比,分割其中点之间红色连线,标记分割点
第3步:平移红色连线,使其分割点与相对的原始数据点重合
第4步:调整平移后红色连线的端点与原始数据点的距离,通常缩减40%-80%
算法实现
#-*-coding:utf-8-*-
importnumpyasnp
defbezier_curve(p0,p1,p2,p3,inserted):
"""
三阶贝塞尔曲线
p0,p1,p2,p3-点坐标,tuple、list或numpy.ndarray类型
inserted-p0和p3之间插值的数量
"""
assertisinstance(p0,(tuple,list,np.ndarray)),u'点坐标不是期望的元组、列表或numpy数组类型'
assertisinstance(p0,(tuple,list,np.ndarray)),u'点坐标不是期望的元组、列表或numpy数组类型'
assertisinstance(p0,(tuple,list,np.ndarray)),u'点坐标不是期望的元组、列表或numpy数组类型'
assertisinstance(p0,(tuple,list,np.ndarray)),u'点坐标不是期望的元组、列表或numpy数组类型'
ifisinstance(p0,(tuple,list)):
p0=np.array(p0)
ifisinstance(p1,(tuple,list)):
p1=np.array(p1)
ifisinstance(p2,(tuple,list)):
p2=np.array(p2)
ifisinstance(p3,(tuple,list)):
p3=np.array(p3)
points=list()
fortinnp.linspace(0,1,inserted+2):
points.append(p0*np.power((1-t),3)+3*p1*t*np.power((1-t),2)+3*p2*(1-t)*np.power(t,2)+p3*np.power(t,3))
returnnp.vstack(points)
defsmoothing_base_bezier(date_x,date_y,k=0.5,inserted=10,closed=False):
"""
基于三阶贝塞尔曲线的数据平滑算法
date_x-x维度数据集,list或numpy.ndarray类型
date_y-y维度数据集,list或numpy.ndarray类型
k-调整平滑曲线形状的因子,取值一般在0.2~0.6之间。默认值为0.5
inserted-两个原始数据点之间插值的数量。默认值为10
closed-曲线是否封闭,如是,则首尾相连。默认曲线不封闭
"""
assertisinstance(date_x,(list,np.ndarray)),u'x数据集不是期望的列表或numpy数组类型'
assertisinstance(date_y,(list,np.ndarray)),u'y数据集不是期望的列表或numpy数组类型'
ifisinstance(date_x,list)andisinstance(date_y,list):
assertlen(date_x)==len(date_y),u'x数据集和y数据集长度不匹配'
date_x=np.array(date_x)
date_y=np.array(date_y)
elifisinstance(date_x,np.ndarray)andisinstance(date_y,np.ndarray):
assertdate_x.shape==date_y.shape,u'x数据集和y数据集长度不匹配'
else:
raiseException(u'x数据集或y数据集类型错误')
#第1步:生成原始数据折线中点集
mid_points=list()
foriinrange(1,date_x.shape[0]):
mid_points.append({
'start':(date_x[i-1],date_y[i-1]),
'end':(date_x[i],date_y[i]),
'mid':((date_x[i]+date_x[i-1])/2.0,(date_y[i]+date_y[i-1])/2.0)
})
ifclosed:
mid_points.append({
'start':(date_x[-1],date_y[-1]),
'end':(date_x[0],date_y[0]),
'mid':((date_x[0]+date_x[-1])/2.0,(date_y[0]+date_y[-1])/2.0)
})
#第2步:找出中点连线及其分割点
split_points=list()
foriinrange(len(mid_points)):
ifi<(len(mid_points)-1):
j=i+1
elifclosed:
j=0
else:
continue
x00,y00=mid_points[i]['start']
x01,y01=mid_points[i]['end']
x10,y10=mid_points[j]['start']
x11,y11=mid_points[j]['end']
d0=np.sqrt(np.power((x00-x01),2)+np.power((y00-y01),2))
d1=np.sqrt(np.power((x10-x11),2)+np.power((y10-y11),2))
k_split=1.0*d0/(d0+d1)
mx0,my0=mid_points[i]['mid']
mx1,my1=mid_points[j]['mid']
split_points.append({
'start':(mx0,my0),
'end':(mx1,my1),
'split':(mx0+(mx1-mx0)*k_split,my0+(my1-my0)*k_split)
})
#第3步:平移中点连线,调整端点,生成控制点
crt_points=list()
foriinrange(len(split_points)):
vx,vy=mid_points[i]['end']#当前顶点的坐标
dx=vx-split_points[i]['split'][0]#平移线段x偏移量
dy=vy-split_points[i]['split'][1]#平移线段y偏移量
sx,sy=split_points[i]['start'][0]+dx,split_points[i]['start'][1]+dy#平移后线段起点坐标
ex,ey=split_points[i]['end'][0]+dx,split_points[i]['end'][1]+dy#平移后线段终点坐标
cp0=sx+(vx-sx)*k,sy+(vy-sy)*k#控制点坐标
cp1=ex+(vx-ex)*k,ey+(vy-ey)*k#控制点坐标
ifcrt_points:
crt_points[-1].insert(2,cp0)
else:
crt_points.append([mid_points[0]['start'],cp0,mid_points[0]['end']])
ifclosed:
ifi<(len(mid_points)-1):
crt_points.append([mid_points[i+1]['start'],cp1,mid_points[i+1]['end']])
else:
crt_points[0].insert(1,cp1)
else:
ifi<(len(mid_points)-2):
crt_points.append([mid_points[i+1]['start'],cp1,mid_points[i+1]['end']])
else:
crt_points.append([mid_points[i+1]['start'],cp1,mid_points[i+1]['end'],mid_points[i+1]['end']])
crt_points[0].insert(1,mid_points[0]['start'])
#第4步:应用贝塞尔曲线方程插值
out=list()
foritemincrt_points:
group=bezier_curve(item[0],item[1],item[2],item[3],inserted)
out.append(group[:-1])
out.append(group[-1:])
out=np.vstack(out)
returnout.T[0],out.T[1]
if__name__=='__main__':
importmatplotlib.pyplotasplt
x=np.array([2,4,4,3,2])
y=np.array([2,2,4,3,4])
plt.plot(x,y,'ro')
x_curve,y_curve=smoothing_base_bezier(x,y,k=0.3,closed=True)
plt.plot(x_curve,y_curve,label='$k=0.3$')
x_curve,y_curve=smoothing_base_bezier(x,y,k=0.4,closed=True)
plt.plot(x_curve,y_curve,label='$k=0.4$')
x_curve,y_curve=smoothing_base_bezier(x,y,k=0.5,closed=True)
plt.plot(x_curve,y_curve,label='$k=0.5$')
x_curve,y_curve=smoothing_base_bezier(x,y,k=0.6,closed=True)
plt.plot(x_curve,y_curve,label='$k=0.6$')
plt.legend(loc='best')
plt.show()
下图为平滑效果。左侧是封闭曲线,两个原始数据点之间插值数量为默认值10;右侧为同样数据不封闭的效果,k值默认0.5.
参考资料
算法参考了InterpolationwithBezierCurves这个网页,里面没有关于作者的任何信息,在此只能笼统地向国际友人表示感谢!
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。