浮点运算:浮点运算结果出现误差原因分析及解决方案疯狂代码！

浮点运算:浮点运算结果出现误差原因分析及解决方案

如下C#代码:

float a = 0.65f;

float b = 0.6f;

float c = a - b;

此时c为多少？

0.05？

！

此时c为0.0499999523！

为什么？

其根本原因是计算机所使用 2进制01代码无法准确表示某些带小数位

十进制数据

下面我们来分析下:

我们知道将

个十进制数值转换为 2进制数值

需要通过下面

计算思路方法:

1. 整数部分:连续用该整数除以2

取余数

然后商再除以2

直到商等于0为止

然后把得到

各个余数按相反

顺序排列

简称"除2取余法"

2. 小数部分:十进制小数转换为 2进制小数

采用"乘2取整

顺序排列"法

用2乘以十进制小数

将得到

整数部分取出

再用2乘余下

小数部分

然后再将积

整数部分取出

如此进行

直到积中

小数部分为0或者达到所要求

精度为止

然后把取出

整数部分按顺序排列起来

即先取出

整数部分作为 2进制小数

高位

后取出

整数部分作为低位有效位

简称"乘2取整法"

3. 含有小数

十进制数转换成 2进制

整数、小数部分分别进行转换

然后相加

例如:将十进制数值25.75转换为 2进制数值

步骤如下:

25(整数部分)

25/2=12......1

12/2=6.......0

6/2=3......0

3/2=1......1

1/2=0......1

(25) 10=(11001) 2

0.75(小数部分)

0.75*2=1.5......1

0.5*2=1......1

(0.75) 10=(0.11) 2

(25.75) 10=(11001) 2+(0.11) 2=(11001.11) 2

按照上述思路方法

我们将0.65及0.6转换为 2进制代码:

(0.65)10 = (0.101001100110011001100110011001100110011......)2

(0.6) 10 = (0.10011001100110011001100110011001100110011......)2

后面

省略号表示已经算不完了

后面在无限重复 0011 这段 2进制数值

文章开始部分

我们用

float类型

下面我们来看看float类型是否能存储上面转换出

2进制代码

目前计算机上存储浮点数值是按照IEEE(电气和电子工程师协会)754浮点存储格式标准来存储

IEEE单精度浮点格式共32位

包含 3个构成字段:23位小数f

8位偏置指数e

1位符号s

将这些字段连续存放在

个32位字里

并对其进行编码

其中0:22位包含23位

小数f； 23:30位包含8位指数e；第31位包含符号s

如下图所示:

也就是说上面将0.65及0.5转换出

2进制代码

我们只能存储23位

即使数据类型为double

也只能存储52位

这样大家便能看出问题出现

原因了

截取

2进制代码已无法正确表示0.65及0.5

根据这个 2进制代码肯定无法正确得到结果0.05

如何解决这个问题？知道其根本原因后

我们知道是无法从根本上解决这个问题

但我们可以有

些曲线救国

思路方法

下面列举几个:

1.

2进制数值可以准确表示整数(可以使用整数转换为 2进制思路方法验证下)

所以可以将小数乘以10或100等变成整数

然后做运算

最后再通过除以10或100等获得结果；

2. 通过截取结果

有效小数位数等

来取得最好

近似结果

然后在做处理

3. 对于可以用有限长度

2进制数值表示

十进制数值

可以使用存储位数大于其长度

数据类型

解决方案正在补充中……

若各位有什么好

思路方法也可以提出来！

以上解决方案需要按照使用

实际情况来决定使用哪种思路方法

Tag标签: 浮点运算误差

Tags: arm浮点运算 cpu浮点运算什么是浮点运算浮点运算

浮点运算:浮点运算结果出现误差原因分析及解决方案

延伸阅读

最新评论

发表评论

赞助商广告

随机更新

热门标注

最近更新

最新标注