NumPy 的 nan 如何理解?

原创
2020/11/23 23:05
阅读数 10
Python与算法社区
439 篇原创,干货满满
值得 星标


01

02

03


三步加星标






你好,我是 zhenguo


Python 中表示空数据使用 None,它是 NoneType 类型,如下所示:


In [59]: type(None)            
Out[59]: NoneType


NoneType 类型没有对外公开属性和方法:



因此,None 比较容易理解,就是一种空类型。


但是使用过 NumPy 的肯定都会接触到 nan 这种类型,它的其他写法:NaN或 NAN,查看其类型却发现是 float 类型:


In [63]: type(np.nan)                    
Out[63]: float


这不免让人心生疑惑,nan 不是空数据,而是浮点数,那么到底等于多少?


原来这并不是NumPy特有的数值,而是IEEE754规定的特殊浮点数之一。


特殊在哪里?


这就要知道计算机是如何表示浮点数的,IEEE754 标准中规定 float 单精度浮点数,在机器中表示用 1 位表示数字的符号,用 8 位表示指数,用 23 位表示尾数,即小数部分,如下图所示:



关于浮点数表示更加详细的解释可参考下面链接,在此不详细展开:


https://blog.csdn.net/k346k346/article/details/50487127


对于单浮点数,指数部分由8位组成,所以取值范围:0到255,而指数等于0,255 这两个值,IEEE754 标准有特别的规定:


1. 当指数等于0,并且小数点后所有位全为 0,则这个数为 0


2. 当指数等于255,并且小数点后所有位全为 0,则这个数为无穷,当符号位为0时正无穷 float('inf'),当符号位为1时负无穷 float('-inf')


3. 当指数等于255,并且小数点后至少一位不为 0,规定此浮点数为 nan,表达的含义:not a number ,不是一个数


以上就是 NumPy 中 nan 的解释,弄清楚本质后,再来看几个关于它的运算。


既然 nan 不是一个数,所以拿它与任何浮点数比较,返回结果都是 False:


In [64]: np.nan < 0                    
Out[64]: False

In [65]: np.nan == np.nan                     
Out[65]: False

In [66]: np.nan < np.inf                     
Out[66]: False


找出 np.nan 出现的索引位置,可以使用 isnan 方法:


In [67]: a = np.array([-9,np.nan,10,np.nan])
# 找出np.nan出现的索引
In [68]: a.where(np.isnan(a)) 
# 返回结果
# (array([1, 3]),)



更多关于NumPy的用法,可参考我之前推过的一个100 页 NumPy 精华PDF,很不错,还没看到的可以微信我,备注:精华


不必打赏
给我点个赞
就心满意足了

本文分享自微信公众号 - Python与算法社区(alg-channel)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部