Python中关于浮点数的冷知识
本周的PyCoder'sWeekly上分享了一篇小文章,它里面提到的冷知识很有意思,我稍作补充,分享给大家。
它提到的部分问题,读者们可以先思考下:
- 若两个元组相等,即a==b且aisb,那么相同索引的元素(如a[0]、b[0])是否必然相等呢?
- 若两个对象的hash结果相等,即hash(a)==hash(b),那么它们是否必然相等呢?
答案当然都为否(不然就不叫冷知识了),大家可以先尝试回答一下,然后再往下看。
-----思考分割线-----
好了,先来看看第一个问题。两个相同的元组a、b,它们有如下的关系:
>>>a=(float('nan'),) >>>b=a >>>a#(nan,) >>>b#(nan,) >>>type(a),type(b) (, ) >>>a==b True >>>aisb#即id(a)==id(b) True >>>a[0]==b[0] False
以上代码表明:a等于b(类型、值与id都相等),但是它们的对位元素却不相等。
两个元组都只有一个元素(逗号后面没有别的元素,这是单元素的元组的表示方法,即len(a)==1)。float()是个内置函数,可以将入参构造成一个浮点数。
为什么会这样呢?先查阅一下文档,这个内置函数的解析规则是:
sign::="+"|"-" infinity::="Infinity"|"inf" nan::="nan" numeric_value::=floatnumber|infinity|nan numeric_string::=[sign]numeric_value
它在解析时,可以解析前后的空格、前缀的加减号(+/-)、浮点数,除此之外,还可以解析两类字符串(不区分大小写):"Infinity"或"inf",表示无穷大数;“nan”,表示不是数(not-a-number),确切地说,指的是除了数以外的所有东西。
前面分享的第一个冷知识就跟“nan”有关,作为整体,两个元组相等,但是它们唯一的元素却不相等。之所以会这样,因为“nan”表示除了数以外的东西,它是一个范围,所以不可比较。
作为对比,我们来看看两个“无穷大的浮点数”是什么结果:
>>>a=(float('inf'),) >>>b=a >>>a#(inf,) >>>b#(inf,) >>>a==b#True >>>aisb#True >>>a[0]==b[0]#True
注意最后一次比较,它跟前面的两个元组恰好相反,由此,我们可以得出结论:两个无穷大的浮点数,数值相等,而两个“不是数的东西”,数值不相等。
化简一下,可以这样看:
>>>a=float('inf') >>>b=float('inf') >>>c=float('nan') >>>d=float('nan') >>>a==b#True >>>c==d#False
以上就是第一个冷知识的揭秘。接着看第二个:
>>>hash(float('nan'))==hash(float('nan')) True
前面刚说了两个“不是数的东西”不相等,这里却显示它们的哈希结果相等,这挺违背常理的。
我们可以推理出一条简单的结论:不相等的两个对象,其哈希结果可能相等。
原因在于,hash(float('nan'))的结果等于0,它是个固定值,作比较时当然就相等了。
其实,关于hash()函数,还埋了一个彩蛋:
>>>hash(float('inf'))#314159 >>>hash(float('-inf'))#-314159
有没有觉得这个数值很熟悉啊?它正是圆周率的前五位3.14159,去除小数点后的结果。在早期的Python版本中,负无穷大数的哈希结果其实是-271828,正是取自于自然对数e。这两个数都是硬编码在Python解释器中的,算是某种致敬吧。
由于float('nan')的哈希值相等,这通常意味着它们不可以作为字典的不同键值,但是事实却出人意料:
>>>a={float('nan'):1,float('nan'):2} >>>a {nan:1,nan:2} #作为对比: >>>b={float('inf'):1,float('inf'):2} >>>b {inf:2}
如上所示,两个nan键值在表示上一模一样(注意,它们没有用引号括起来),它们可以共存,而inf却只能归并成一个,再次展示出了nan的神奇。
好了,两个很冷的小知识分享完毕,背后的原因都在于float()取浮点数时,Python允许了nan(不是数)的存在,它表示不确切的存在,所以导致了这些奇怪的结果。
最后,我们作下小结:
- 包含float('nan')的两个元组,当做整体作比较时,结果相等;两个相等的元组,其对位的元素可能不相等
- float('nan')表示一个“不是数”的东西,它本身不是确定值,两个对象作比较时不相等,但是其哈希结果是固定值,作比较时相等;可用作字典的键值,而且是不冲突的键值
- float('inf')表示一个无穷大的浮点数,可看作确定的值,两个对象做比较时相等,其哈希结果也相等;可用作字典的键值,但是会产生冲突
- float('nan')的哈希结果为0,float('inf')的哈希结果为314159
参考资料:
https://docs.python.org/3/library/functions.html#float
https://www.pythondoeswhat.com/2019/09/welcome-to-float-zone.html
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对毛票票的支持。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。