(转)从Python的0.1输出0.1000000000000001说浮点数的二进制

原文地址:http://blog.csdn.net/u012843100/article/details/60885763

今天在学习Python核心编程的时候,十进制浮点数那段看到一个有趣的事情。

>>>0.1
0.1000000000000001

为什么会这样?文中是这样解释的:

这是因为语言绝大多数C语言的双精度实现都遵守IEEE754规范,其中52位用于底。因此浮点值只能有52位精度,类似这样的值用二进制表示只能像上面那样被截断。0.1的二进制表示是0.11001100110011…*2^-3,因为它最接近的二进制近似值是0.0001100110011…,或1/16+1/32+1/256+…

意思就是四舍五入之后就变成0.1000000000000001了,上面这段话可能很多人似懂非懂。

可能是我在Python 3跟Python2.7中都试过,并没有上述所说的这种问题,但这个问题还是值得大家来了解下。

下面先来段C#代码证明我本质上还是个.Net程序猿吧:

            float f = 2.15f;
            double d = f;
            Console.WriteLine(d.ToString("0.00000000000"));

            d = 2.15d;
            Console.WriteLine(d.ToString("0.00000000000"));  

            Console.ReadKey();

聪明的你猜猜这里输出的两次结果一样吗?答案是不一样的,不信你可以试试是不是下面这样。 

要解答上面这个0.1的输出,咱们就需要一步步来了。

第一步,先把0.1转成二进制

整数转二进制大家肯定都知道的,这个就不说了,但是小数部分怎么转可能还是有些同学不知道。没关系,附上链接:二进制十进制间小数怎么转换

所以十进制0.1的二进制就是0.00011001100110011…到这里,

0.1的二进制表示是0.11001100110011…*2^-3

这句话就懂了吧。

第二步,大概了解下IEEE 754

IEEE 754 标准是IEEE二进位浮点数算术标准(IEEE Standard for Floating-Point Arithmetic)的标准编号,IEEE 754 标准规定了计算机程序设计环境中的二进制和十进制的浮点数自述的交换、算术格式以及方法。

参考: 
百度百科 IEEE 754 
维基百科 IEEE 754

这里引用一段阮一峰的网络日志

根据国际标准IEEE 754,任意一个二进制浮点数V可以表示成下面的形式:

  (1)(-1)^s表示符号位,当s=0,V为正数;当s=1,V为负数。

  (2)M表示有效数字,大于等于1,小于2。

  (3)2^E表示指数位。

举例来说,十进制的5.0,写成二进制是101.0,相当于1.01×2^2。那么,按照上面V的格式,可以得出s=0,M=1.01,E=2。

十进制的-5.0,写成二进制是-101.0,相当于-1.01×2^2。那么,s=1,M=1.01,E=2。

IEEE 754规定,对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。 
 
对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。 

IEEE 754对有效数字M和指数E,还有一些特别规定。

前面说过,1≤M<2,也就是说,M可以写成1.xxxxxx的形式,其中xxxxxx表示小数部分。IEEE 
754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。

至于指数E,情况就比较复杂。

首先,E为一个无符号整数(unsigned 
int)。这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 
754规定,E的真实值必须再减去一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。

比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

然后,指数E还可以再分成三种情况:

(1)E不全为0或不全为1。这时,浮点数就采用上面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。

(2)E全为0。这时,浮点数的指数E等于1-127(或者1-1023),有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。

(3)E全为1。这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);如果有效数字M不全为0,表示这个数不是一个数(NaN)。

第三步,把十进制0.1用32位bit位表示

0.1的二进制是1.100110011001100110011001…*2^-4 
根据公式 

正数符号位为0;省略第一位的1,M为100110011001100110011001;E=-4+127=123,二进制表示为

可以得出 s=0,M=100 1100 1100 1100 1100 1100,E=0111 1011

所以写成二进制形式是 
0 10011001100110011001100 01111011

第四步,把前两步都忘了然后把二进制转回十进制

这个怎么转回10进制呢?刚刚十进制转二进制是乘2得出每一位,那现在就是反过来,每一位除以2加起来就是了。 
刚刚说的0.1的二进制

0.0001100110011…

转回十进制大概是这样

1*(2^-4)+1*(2^-5)+1*(2^-8)+1*(2^-9)+1*(2^-11)+…

算出来的结果应该就是0.1000000000000001,也就是结论了。 
有耐心的你去验证下,反正我没耐心算。

细想一下好像不对呀…截断后这个值怎么都比原来的值要小吧?好吧,看来不是这个原因。

然后C#那段代码是为啥呢?至于为啥呢?单精度浮点数(float)有效位是23位,双精度浮点数(double)有效位是52位。我也只能帮到这里了。

时间: 2024-10-08 22:37:51

(转)从Python的0.1输出0.1000000000000001说浮点数的二进制的相关文章

python中,a=10.0 b=10.0 a is b 为什么输出是false

>>>a=10.0>>>b=10.0>>>a is bFalse为什么当a=10,b=10时,a is b输出的是True呢? >>>a=10.0 >>>b=10.0>>>a is bFalse 为什么当a=10,b=10时,a is b 输出的是True呢? a is b 比较的是变量a与变量b的内存地址是否相同,即 id(a)==id(b) Python的内置函数id就是用来查看变量地址的 id

深度学习 GPU环境 Ubuntu 16.04 + Nvidia GTX 1080 + Python 3.6 + CUDA 9.0 + cuDNN 7.1 + TensorFlow 1.6 环境配置

本节详细说明一下深度学习环境配置,Ubuntu 16.04 + Nvidia GTX 1080 + Python 3.6 + CUDA 9.0 + cuDNN 7.1 + TensorFlow 1.6. Python 3.6 首先安装 Python 3.6,这里使用 Anaconda 3 来安装,下载地址:https://www.anaconda.com/download/#linux,点击 Download 按钮下载即可,这里下载的是 Anaconda 3-5.1 版本,如果下载速度过慢可以选

ParisGabriel:Python全栈工程师(0基础到精通)教程 第二十二课(迭代器、字节串)

ParisGabriel 每天坚持手写  一天一篇  决定坚持几年 为了梦想为了信仰 Python人工智能从入门到精通 迭代器 Iterator: 用<>括号表示的一定是对象 什么是迭代器? 迭代器是访问可迭代对象的工具 迭代器是指用iter(obj) 函数返回的对象(实例) 迭代器可以用next(it) 函数获取可迭代对象的数据 迭代器函数iter和next iter(iterable) 从可迭代对象中返回一个迭代器,iterable 必须是能提供一个迭代器的对象 next(iterator

String.Format数字格式化输出 {0:N2} {0:D2} {0:C2} (转)

String.Format数字格式化输出 {0:N2} {0:D2} {0:C2} (转) //格式为sring输出 // Label1.Text = string.Format("asdfadsf{0}adsfasdf",a); // Label2.Text = "asdfadsf"+a.ToString()+"adsfasdf"; // Label1.Text = string.Format("asdfadsf{0:C}adsfas

Python源码剖析笔记0 ——C语言基础

python源码剖析笔记0--C语言基础回顾 要分析python源码,C语言的基础不能少,特别是指针和结构体等知识.这篇文章先回顾C语言基础,方便后续代码的阅读. 1 关于ELF文件 linux中的C编译得到的目标文件和可执行文件都是ELF格式的,可执行文件中以segment来划分,目标文件中,我们是以section划分.一个segment包含一个或多个section,通过readelf命令可以看到完整的section和segment信息.看一个栗子: char pear[40]; static

String.Format数字格式化输出 {0:N2} {0:D2} {0:C2}

String.Format数字格式化输出 {0:N2} {0:D2} {0:C2} 数字 {0:N2} 12.36 数字 {0:N0} 13 货币 {0:c2} $12.36 货币 {0:c4} $12.3656 货币 "¥{0:N2}" ¥12.36 科学计数法 {0:E3} 1.23E+001 百分数 {0:P} 12.25% P and p present the same. 日期 {0:D} 2006年11月25日 日期 {0:d} 2006-11-25 日期 {0:f} 20

Python黑帽编程 4.0 网络互连层攻击概述

Python黑帽编程 4.0 网络互连层攻击概述 是时候重新温习下下面这张图了. 图2 本章的内容核心包含上图中的网络层和传输层.TCP/IP是整个网络协议体系中的核心,因为从这里开始,数据传输从局域网迈向了广阔的互联网,我们的程序也有能力处理来自互联网的数据,可以直接对互联网上的主机进行攻击和测试. 还是老话,希望各位深入的学习协议,通过抓包工具练习数据包分析,通过实例理解协议.下面我们把本章涉及到的内容做简略的描述. 4.0.1 嗅探与嗅探器原理 嗅探是一个综合概念,涉及到我们之前讲到的第二

第二次实验判断成绩等级。 给定一百分制成绩,要求输出成绩的等级。90以上为A,80-89为B,70-79为C,60-69为D,60分以下为E,输入大于100或小于0时输出“输入数据错误”。 分别用if和用switch语句实现判断成绩等级。 给定一百分制成绩,要求输出成绩的等级。90以上为A,80-89为B,70-79为C,60-69为D,60分以下为E,输入大于100或小于0时输出“输入数据错误”

一:实验内容:1:判断成绩等级. 给定一百分制成绩,要求输出成绩的等级.90以上为A,80-89为B,70-79为C,60-69为D,60分以下为E,输入大于100或小于0时输出“输入数据错误”. 分别用if和用switch语句实现 #include <stdio.h> int main() { int grade; scanf("%d",&grade); if(grade>100||grade<0) { printf("数据错误")

VC6.0 多线程输出乱序问题

今天尝试编写多线程最简单的例子 #include "stdafx.h" #include "windows.h" #include <iostream> using namespace std; DWORD WINAPI Fun1Proc(LPVOID lpParamer); int main(int argc, char* argv[]) { HANDLE hThread; hThread=CreateThread(NULL,0,Fun1Proc,NU