小数在内存中是如何存储的?

小数在内存中是如何存储的?

文本关键字:小数、float、double、浮点数、精度

一、IEEE 754(二进制浮点数算术标准)

在学习进制转换时,我们了解到:我们经常使用的十进制数是转换为二进制进行存储的,只需要按照顺序将转换后的结果放在对应的位置上就行了。其实小数的存储也是基于二进制的,不过由于小数由整数部分和小数部分组成,为了方便表示和比较,会使用另外的方式来存储。
IEEE 754是最广泛使用的浮点数运算标准,在标准中规定了四种表示浮点数值的方式:

  • 单精度:32位 - 4字节
  • 双精度:64位 - 8字节
  • 延伸单精度:43+
  • 延伸双精度:79+
    对于进制转换不清楚的同学可以进传送门:进制之间如何转换?

    1. 存储结构

    小数在内存中的存储由三部分组成,分别是符号、阶码(或称指数)、尾数。符号位我们很熟悉,只占一位,并且出现在最高位,0为正,1为负。

  • 单精度:符号1位,阶码8位,尾数23位
  • 双精度:符号1位,阶码11位,尾数52位
  • 延伸精度很少使用,不做介绍

2. 存储方式

一个十进制的小数在进行存储时,首先要将整数部分与小数部分都转换为二进制,然后再整理成类似科学技术法的形式,即:移动小数点,使得小数点的左边只有一位,并且只可能为1(因为是二进制),小数点右侧的部分即为尾数部分,移动小数点的位数将会被记录在指数部分中。为了能够透彻的理解十进制小数转化存储在内容中的过程,我们还需要了解一个概念:阶码。

二、阶码(指数)

1. 定义

对于一个二进制数,我们总可以把它整理成:尾数 ?? 2的P次方的形式,其中P就被定义为阶码,我们也可以认为2是底数,P为指数,以整数形式表示。

2. 为什么小数被称作浮点数?

  • 定点小数

在早期计算机中,为了节省硬件资源,阶码P的值是被固定的,那么小数的表示形式也同时被固定了。规定第一位为符号位,小数点固定在第一位后面,这种小数是纯小数,被称为定点小数。

  • 浮点小数

与定点小数相对的,如果阶码P可变,那这种小数表示法就被称为浮点表示,这样的数也就被称为浮点数了。更为重要的一点,P指明了小数点的位置。

3. 移码

明白了阶码的概念,也了解了浮点数的前世今生,那么我们大费周章的说这个概念干什么呢?没错,重点来了,就是为了这个移码的码制。在进行小数点移动时,需要先将十进制数转换为二进制,再去移动小数点,保证小数点左侧只有一位,且数值为1。

  • 对于绝对值大于2的数,这个时候我们向左移动小数点,对应的指数为正数;
  • 对于一个绝对值小于1的数,这个时候我们向右移动小数点,对应的指数为负数;
  • 绝对值在1和2之间的数嘞?这个时候不用移动好叭。。。

那么问题就来了,我们的指数有的时候正,有的时候负。But!更为严重的问题是,在指数部分对应的区间并没有符号位这个东西,最前面的符号位代表的是小数本身的正负,这就使得存储和比较都变得困难,所以我们希望通过一种修正的方式避开正负号的问题。怎么做呢?以float为例,指数部分长度为8。
原有带符号位的8个bit的存储范围是-128 ~ 127(不明白的同学可以进传送门为什么一个byte的存储范围是-128~127?),也就是说可以记录-128次方到+127方之间的所有指数值。如果忽略符号位,把它也当做一个数据的存储位,那么范围就是0~255,我们取这个数的一半作为修正值,即:127,把每次移动小数点后获得的指数值都加上127。

  • 小数点向左移动3位,对应的指数为+3,存入指数部分的值即为130的二进制表示
  • 小数点向右移动2位,对应的指数为-2,存入指数部分的值即为125的二进制表示

这样的好处就是避开了符号的问题,同时,原有的指数的值也得到的了保存,取出的时候减掉127就好了。那么直观的讲,原来的范围是-128 ~ 127,加上127之后范围应该变成-1 ~ 254,貌似对应关系有问题呀~这其实是一个很简单的二进制换算问题,对于有符号数,最高位为符号位,用1代表负数,-128的补码为:1000 0000,但是这在无符号数眼里的值为128,-1的补码为:1111 1111,但是在无符号数眼里值为255。所以我们不能直接通过加减法得出这个取值范围,而应该结合二进制存储的规则(不明白的同学可以二进传送门查看补码相关的知识:为什么一个byte的存储范围是-128~127?)。

三、小数的进制转换

说了这么久,我们用几个例子来给大家演示一下,会给大家列出小数在内存中存储的完整表示,在这之前还是需要先学习一下十进制小数应该怎么转换为二进制(读者内心:我太难了。。。)。

1. 十进制转二进制

小数分为整数部分和小数部分,整数部分的转换照常进行,不断的除2得到,小数部分刚好是不断的乘2得到,一直到小数部分为0,或者已经达到了对应的精度,以69.3125为例。

  • 整数部分:69 = 64 + 4 + 1 = 2^6 + 2^2 + 2^0

    • 对应的二进制数为:0100 0101
  • 小数部分:转换过程如下 -> 不断乘2,取出结果中的整数部分
    • 对应的二进制数为:0101

  • 最终转换结果:0100 0101.0101

    2. 二进制转十进制

    由二进制转换为十进制比较简单,就是运算规则做相反的运算,整数部分是做除法得到的,那么转换回去的时候就是做乘法,小数部分是做乘法得到的,那么转换回去的时候就做除法,以0100 0101.0101为例。

  • 整数部分:2^6 + 2^2 + 2^0 = 64 + 4 + 1 = 69
  • 小数部分:0 x 2^-1 + 1 x 2^-2 + 0 x 2^-3 + 1 x 2^-4 = 0.3125

可以看到规律其实是统一的,就是从左至右根据二进制数乘以2的n次方,从左至右n的值不断递减,在个位处,n的值为0,进入小数部分n的值为负数,在运算上的体现为除法。

3. 小数在内存中的存储表示

  • 99.9

9.9的二进制表示:1100011.111001100110011001100110011001100110011001101。现在我们需要将小数点左移6位,对应的指数值为+6。此时小数点右侧的位数为51位,这些将会被存放在尾数部分,如果使用double类型可以将数据全部记录,但是如果使用float类型,由于尾数部分只有23位,所有只能记录部分的数据,误差也就产生了!
整理一下,符号位为0,指数部分为6+127=133,尾数部分直接丢进去,能装多少装多少,以float为例。
最终表示为:0 10000101 10001111100110011001100

  • 0.226

0.226的二进制表示:0.0011100111011011001000101101000011100101011000000100001。此时小数点需要右移3位,对应的指数值为-3,剩下的尾数部分同样能塞多少塞多少。
整理一下,符号位为0,指数部分为-3+127=124,以float为例。
最终表示为:0 1111100 11001110110110010001011

四、float与double

1. 精度范围

从上面的例子我们可以看到,当一个小数在存储的过程中,误差就已经产生了,而且由于是转换为二进制存储,我们很难对所有的小数进行判断是否在存储时丢失了精度。看下面几个例子:

    public static void main(String[] args) {
        Float f1 = 99.99999f;
        System.out.println(f1);// 输出结果:99.99999
        // 貌似很正常啊,其实float的内心慌的一批
        Float f2 = 99.999999f;
        System.out.println(f2);// 输出结果:100.0
        // 此时终于暴露了吧?在存储时就已经丢失了精度,在参与小数计算时更加暴露无遗
    }
  • float精度:小数点后6~7位
  • double精度:小数点后15~16位

丢失精度的原因经过上面的分析和例子相信大家应该很清楚了,我们按照常规流程进行二进制转换后得到的尾数部分可能很长,但是以单精度或双精度进行存储时只能存储一部分,那么必然导致精度的丢失。

2. 解决精度不足

float和double作为基本数据类型使用起来当然是比较方便,但是精度的问题会造成不准确,虽然我们可以通过使用保留几位小数的方式勉强应对,但是为了保证高精度通常会使用BigDecimal,具体用法不在此赘述,将在后续文章中说明。

3. 与长整型的比较

我们在接触基本数据类型的时候曾经碰到过一个大哥大,曾以为能够装进去很大很大的整数,毕竟是8字节的身材,但是仔细那么一比较,存储范围竟然还比不过4字节的float,更不要说同等身材的double了。

  • long的存储范围:-2^63 ~ 2^63 - 1
  • float:-2^128 ~ 2^128
  • double:-2^1024 ~ 2^1024

以上数据只是表示一个量级,不能代表浮点数的精确范围,不过这也足够碾压long类型了,以至于long类型可以隐式转换为float,这就解决了我们的一个疑问,为什么4字节的float存储范围比8字节的long类型还要大?自然是存储方式不同。

原文地址:https://blog.51cto.com/10984944/2475898

时间: 2024-08-28 07:13:01

小数在内存中是如何存储的?的相关文章

float数据在内存中是怎么存储的

float类型数字在计算机中用4个字节存储.遵循IEEE-754格式标准: 一个浮点数有2部分组成:底数m和指数e 底数部分 使用二进制数来表示此浮点数的实际值指数部分 占用8bit的二进制数,可表示数值范围为0-255 但是指数可正可负,所以,IEEE规定,此处算出的次方必须减去127才是真正的指数. 所以,float类型的指数可从-126到128 底数部分实际是占用24bit的一个值,但是最高位始终为1,所以,最高位省去不存储,在存储中占23bit 科学计数法. 格式:SEEE EEEE E

Java语言中:float、double数据类型在内存中是如何存储的

引用参考 https://www.cnblogs.com/chenmingjun/p/8415464.html#4291528 https://blog.csdn.net/yansmile1/article/details/70145416 java语言中,float类型数字在计算机中用4个字节(32位)来存储.double类型占用8个字节(64位). 从存储结构和算法上来讲,double和float是一样的,不一样的地方仅仅是float是32位的,double是64位的,所以double能存储

C# CLR via 对象内存中堆的存储【类型对象指针、同步块索引】

最近在看书,看到了对象在内存中的存储方式. 讲到了对象存储在内存堆中,分配的空间除了类型对象的成员所需的内存量,还有额外的成员(类型对象指针. 同步块索引 ),看到这个我就有点不懂了,不知道类型对象指针是什么,指向的什么? 从网上找也没有找到,最后往下看,书中有些描述.说下我的理解: 类型对象指针:指向类型对象存储的地址,假如有一个类型Person,它在堆中有一块区域存储它内部的字段和成员以及两个额外成员(类型对象指针. 同步块索引 ),类型对象的类型对象指针指向的是System.Type的地址

JavaScript中的变量在内存中的具体存储形式

栈内存和堆内存 JavaScript中的变量分为基本类型和引用类型 基本类型是保存在栈内存中的简单数据段,它们的值都有固定的大小,保存在栈空间,通过按值访问 引用类型是保存在堆内存中的对象,值大小不固定,栈内存中存放的该对象的访问地址指向堆内存中的对象,JavaScript不允许直接访问堆内存中的位置,因此操作对象时,实际操作对象的引用 结合代码与图来理解 let a1 = 0; // 栈内存let a2 = "this is string" // 栈内存let a3 = null;

java中的各种数据类型在内存中存储的方式

1.java是如何管理内存的 java的内存管理就是对象的分配和释放问题.(其中包括两部分) 分配:内存的分配是由程序完成的,程序员需要通过关键字new为每个对象申请内存空间(基本类型除外),所有的对象都在堆(Heap)中分配空间.释放:对象的释放是由垃圾回收机制决定和执行的,这样做确实简化了程序员的工作.但同时,它也加重了JVM的工作.因为,GC为了能够正确释放对象,GC必须监控每一个对象的运行状态,包括对象的申请.引用.被引用.赋值等,GC都需要进行监控. 2.什么叫java的内存泄露 在j

C# 数组在内存中的存储

C# 数组是引用类型,那么在内存中是如何存储的呢? 在VS中调试C#程序,如何查看内存.寄存器.反汇编 在这篇文章里看到了如何在VS 中查看内存 先断点打在数组创建后语句那里,点debug->Windows->Memory, 选一个随便memory 在immediate window里 输入 &变量名 arr,获取arr的内存地址. &arr0x009becd8  ----->在堆栈中引用地址 *&arr: 0x02d75cb4  ----->在托管堆中空间

浮点数在内存中的存放方式

C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit,double数据占用64bit,我们在声明一个变量float f= 2.25f的时候,是如何分配内存的呢?如果胡乱分配,那世界岂不是乱套了么,其实不论是float还是double在存储方式上都是遵从IEEE的规范的,float遵从的是IEEE R32.24 ,而double 遵从的是R64.53. 无论是单精度还是双精度在存储中都分为三个部分: 符号位(Sign)

简单了解:在内存中的数据

内存原理 开启电源,启动BIOS,CPU工作,调用内存,内存跟硬盘索要资源 当你点击一个文件的时候数据经过数据总线传达到CPU,CPU发送指令到内存,内存那里会跟硬盘沟通,问他有没有这个东西,他说有,你就会看到这个文件夹里面是什么东西. (Xee:RAM 是随机存取存储器,它的特点是易挥发性,即掉电失.--妈蛋,难怪一断电,我的东西没保存,就找不到了-- 既然内存是用来存放当前正在使用的(即执行中)的数据和程序,那么它是怎么工作的呢?我们平常所提到的计算机的内存指的是动态内存(即DRAM),动态

韩顺平_PHP程序员玩转算法公开课(第一季)02_单链表在内存中存在形式剖析_学习笔记_源代码图解_PPT文档整理

文西马龙:http://blog.csdn.net/wenximalong/链表——最灵活的数据结构链表用来解决复杂的问题和算法是很方便的. 内容介绍1.什么是链表2.单向链表3.双向链表4.环形链表5.使用环形链表解决约瑟夫问题 链表——什么是链表链表是有序的列表,但是它在内存中是分散存储的. 链表无处不在,比如在操作系统中,文件和文件之间,文件块和文件块之间,是靠链表链接起来的.使用链表可以解决类似约瑟夫问题,排序,索引,二叉树,广义表... 链表——单链表的快速入门使用head头的单向链表