c语言中float、double、long double在内存中存储方式

存储格式中的二机制转为浮点数:

 浮点型变量在计算机内存中占用4个字节(4 Byte),即32-bit,一个浮点数由2部分组成:底数m  和 指数e;

  底数部分:使用2进制数来表示此浮点数的实际值;

  指数部分:占用8=bit空间来表示,表示数值范围:0-255;后面介绍 用于存储科学计数法中的指数部分,并且采用移位存储方式;

具体分析:

  浮点数据就是按下表的格式存储在4个字节中:

  Address+0 Address+1 Address+2 Address+3 Contents

  SEEE EEEE EMMM MMMM MMMM MMMM MMMM MMMM
      S部分: 表示浮点数正负,1为负数,0为正数。一位即可

  E部分:指数加上127后的值的二进制数(why是加上了127之后的值? 由于指数应可正可负,所以IEEE规定,此处算出的次方须减去127才是真正的指数。所以float的指数可从 -126到128.)

  M部分:24-bit的底数(底数部分实际是占用24-bit的一个值,由于其最高位始终为 1 ,所以最高位省去不存储,在存储中只有23-bit。)

  特例:浮点数 为0时,指数和底数都为0,但此前的公式不成立。因为2的0次方为1,所以,0是个特例。这个特例也不用认为去干扰,编译器会自动去识别。

 举例:看下-12.5在计算机中存储的具体数据:0xC1 0x48 0x00 0x00

  二进制:11000001 01001000 00000000 00000000

   格式:SEEE EEEE EMMM MMMM MMMM MMMM MMMM MMMM

  可见:

    S: 为1,是个负数。

    E:(8-bit)为 10000010 转为10进制为130,130-127=3,即实际指数部分为3.

    M:(23-bit)为 10010000000000000000000。底数实际上是:1.10010000000000000000000

  现在,我们通过指数部分E的值来调整底数部分M的值。

    调整方法为:如果指数E为负数,底数的小数点向左移,如果指数E为正数,底数的小数点向右移。小数点移动的位数由指数E的绝对值决定。

    这里,E为正3,使用向右移3为即得: 1100.10000000000000000000

  转换过程:小数点左边的1100 表示为 (1 × 2^3) + (1 × 2^2) + (0 × 2^1) + (0 × 2^0), 其结果为 12 。

        小数点右边的 .100… 表示为 (1 × 2^-1) + (0 × 2^-2) + (0 × 2^-3) + ... ,其结果为.5 。

   以上二值的和为12.5, 由于S 为1,使用为负数,即-12.5 。所以,16进制 0XC1480000 是浮点数 -12.5 。

浮点数转存储格式的二进制数:

  下面看下如何将一浮点数装换成计算机存储格式中的二进制数。 举例将17.625换算成 float型。

  1、转为二进制:10001.101

  2、小数点,左移4位,变成1.0001101

  3、这样底数为:1.0001101, 指数为:4+127=131,二进制位:1000011

  4、符号位为0,因为是正数;

  5、合并:0 1000011  0001101后面补0,补成32-bit;

  6、转成16进制:转换成16进制:0x41 8D 00 00

浮点数转成二进制代码形式代码:

 1 #include<iostream>
 2 using namespace std;
 3
 4 #define uchar unsigned char
 5
 6 void binary_print(uchar c)
 7 {
 8         for(int i = 0; i < 8; ++i)
 9         {
10                 if((c << i) & 0x80)
11                         cout << ‘1‘;
12                 else cout << ‘0‘;
13         }
14         cout << ‘ ‘;
15 }
16
17 int main()
18 {
19         float a;
20         uchar c_save[4];
21         uchar i;
22         void *f;
23         f = &a;
24
25         cout<<"pls input a float num:";
26         for(i=4;i!=0;i--)
27                 binary_print(c_save[i-1]);
28         cout<<endl;
29
30         return 0;
31 }

  C标准规定,float类型必须至少能表示6位有效数字,就像33.333 333这样的数字的小数点后的前6位;那么whyfloat能表示6位有效数字呢?

  解释如下:十进制中的9,在二进制中的表示形式是1001,这也就是说: 表示十进制中的一位数在二进制中需要4bit,所以我们现在float中具有24bit的精度,所以float在十进制中具有24/4=6,所以在十进制里,float能够精确到小数点后6位;

  double呢?其实和float原理是一样的,只是double的位数更长一些而已;

        

  注意点,double类型数据操作比float型运算要慢很多;

  

时间: 2024-10-08 22:03:20

c语言中float、double、long double在内存中存储方式的相关文章

C语言中float如何存储?

float 内存如何存储的 类型 存储位数 总位数 偏移值 (offset) 数符(S) 阶码(E) 尾数(M) 短实数(float) 1 8 23 32 127 长实数(double) 1 11 52 64 1023 N (10) = 123.456, 换算成二进制表示: N (2) = 1111011. 01110100101111001 = 1. 11101101110100101111001(...) * 2^6    那么E – 127 = 6;  E = 127 + 6 = 133(

c语言中float精度问题

3.1415926(10进制) == 11.00100100001111110110100110100010010110110000100101(2进制) == 1.100100100001111110110100110100010010110110000100101 * 2 用gdb调试打印float变量里的内容为0x40490fda(16进制),即01000000010010010000111111011010(2进制) 0(最高位0,表示正数)10000000(IEEE规定, 此处算出的次

R 语言中 data table 的相关,内存高效的 增量式 data frame

面对的是这样一个问题,不断读入一行一行数据,append到data frame上,如果用dataframe,  rbind() ,可以发现数据大的时候效率明显变低. 原因是 每次bind 都是一次重新整个数据集的重新拷贝 这个链接有人测试了各种方案,似乎给出了最优方案 http://stackoverflow.com/questions/11486369/growing-a-data-frame-in-a-memory-efficient-manner library(data.table) d

C语言中free()函数释放struct结构体中的规律

并不是什么新鲜的事情,不过值得注意.首先我们知道,在使用struct来定义并声明一个变量时,将会自动划分出一个连续的储存空间(虽然根据某些对齐原则会出现内存间隙,但是大体上来说还是连续的)这一块连续空间将会包括结构体中的其他变量所需要的内存.就像这样.这是一个名为X的结构体变量 而free()函数的作用是对动态分配的内存进行释放,这也就意味着当使用free函数清空一个结构体时,只会清空这个大框里的内存,而不会对a,b,c,d指向的内存进行清理. 当然,一般来说直接定义变量于结构体内会更加方便.

php语言中Excel表格导入数据库的方法详解

在php编程语言中,对于如何在Excel表格中导入数据库的方法是很多编程者比较头疼的一个问题,有些技术人员可能在百度尝试过搜索很多不同的问题,但是给出的答案经过自己测试之后,发现还是行不通,那么对此,燚轩科技也尝试了一下如何在Excel表格中导入数据库,现在将源代码展示给各位技术编程者,大家可以借鉴参考一下. public function saveexcel(){require_once('./Thinkphp/Extend/Vendor/PHPExcel-1.8/Classes/PHPExc

Java语言中:float、double数据类型在内存中是如何存储的

引用参考 https://www.cnblogs.com/chenmingjun/p/8415464.html#4291528 https://blog.csdn.net/yansmile1/article/details/70145416 java语言中,float类型数字在计算机中用4个字节(32位)来存储.double类型占用8个字节(64位). 从存储结构和算法上来讲,double和float是一样的,不一样的地方仅仅是float是32位的,double是64位的,所以double能存储

C语言中,double、long、unsigned、int、char类型数据所占字节数

C语言中,double.long.unsigned.int.char类型数据所占字节数和机器字长及编译器有关系: 所以,int,long int,short int的宽度都可能随编译器而异.但有几条铁定的原则(ANSI/ISO制订的): 1 sizeof(short int)<=sizeof(int) 2 sizeof(int)<=sizeof(long int) 3 short int至少应为16位(2字节) 4 long int至少应为32位. unsigned 是无符号的意思. 16位编

在C语言中,double long unsigned int char 类型数据所占字节数

在C语言中,double  long  unsigned  int  char  类型数据所占字节数和机器字长及编译器有关系:所以,int,long int,short int的宽度都可能随编译器而异.但有下面几条原则(ANSI/ISO制订的): 1 sizeof(short int)<=sizeof(int) 2 sizeof(int)<=sizeof(long int) 3 short int至少应为16位(2字节) 4 long int至少应为32位. unsigned 是无符号的意思.

如何理解IEEE 754标准对Java中float值和double值的规定

在Java语言中,我们可以使用float和double这两种基本数据类型来表示特定的数据. 这两种数据类型,本质上是浮点数(floating-point number),浮点是一种对于实数的近似值数值表现法,由一个有效数字加上幂数来表示. 之所以使用浮点数,是因为计算机在使用二进制运算的过程中,无法将所有的十进制小数准确的换算为二进制,只能使用近似值来表示. 使用浮点数表示数值的方法很多,在Java中,和C语言一样,float和double都采用了使用最为广泛的IEEE 754标准. IEEE