Python 求向量的余弦值操作
1、余弦相似度
余弦相似度衡量的是2个向量间的夹角大小,通过夹角的余弦值表示结果,因此2个向量的余弦相似度为:
余弦相似度的取值为[-1,1],值越大表示越相似。
向量夹角的余弦公式很简单,不在此赘述,直接上代码:
defcosVector(x,y):
if(len(x)!=len(y)):
print('errorinput,xandyisnotinthesamespace')
return;
result1=0.0;
result2=0.0;
result3=0.0;
foriinrange(len(x)):
result1+=x[i]*y[i]#sum(X*Y)
result2+=x[i]**2#sum(X*X)
result3+=y[i]**2#sum(Y*Y)
#print(result1)
#print(result2)
#print(result3)
print("resultis"+str(result1/((result2*result3)**0.5)))#结果显示
cosVector([2,1],[1,1])
一个计算二维数组余弦值的例子:
#求余弦函数
defcosVector(x,y):
if(len(x)!=len(y)):
print('errorinput,xandyisnotinthesamespace')
return;
result1=0.0;
result2=0.0;
result3=0.0;
foriinrange(len(x)):
result1+=x[i]*y[i]#sum(X*Y)
result2+=x[i]**2#sum(X*X)
result3+=y[i]**2#sum(Y*Y)
#print("resultis"+str(result1/((result2*result3)**0.5)))#结果显示
returnresult1/((result2*result3)**0.5)
#print("resultis",cosVector([2,1],[1,1]))
#计算query_output(60,20)和db_output(60,20)的余弦值,用60*1的向量存储
cosResult=[[0]*1foriinrange(60)]
foriinrange(60):
cosResult[i][0]=cosVector(query_output[i],db_output[i])
print(cosResult)
--------------------------------------------------------------------------------------------
#计算query_output和db_output的余弦值,用60*1的向量存储
rows=query_output.shape[0]#行数
cols=query_output.shape[1]#列数
cosResult=[[0]*1foriinrange(rows)]
foriinrange(rows):
cosResult[i][0]=cosVector(query_output[i],db_output[i])
#print(cosResult)
#将结果存入文件中,并且一行一个数字
file=open('cosResult.txt','w')
foriincosResult:
file.write(str(i).replace('[','').replace(']','')+'\n')#\r\n为换行符
file.close()
补充:python实现余弦近似度
方法一:
defcos(vector1,vector2): dot_product=0.0 normA=0.0 normB=0.0 fora,binzip(vector1,vector2): dot_product+=a*b normA+=a**2 normB+=b**2 ifnormA==0.0ornormB==0.0: returnNone else: return0.5+0.5*dot_product/((normA*normB)**0.5)#归一化从[-1,1]到[0,1]
方法二:
num=float(A.T*B)#若为行向量则A*B.T denom=linalg.norm(A)*linalg.norm(B) cos=num/denom#余弦值 sim=0.5+0.5*cos#归一化从[-1,1]到[0,1]
以上为个人经验,希望能给大家一个参考,也希望大家多多支持毛票票。如有错误或未考虑完全的地方,望不吝赐教。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。