浮点数在内存中的存储

return 0；如果纯靠数学思维来思考，那我们自然认为a+b == c，但是通过上面的学习，我们发现有些浮点数其实并不能准确的表示，如图所以程序中的打印结果也并不是，a+b == c而是所以需要换一个判断标准，我们一般会规定一个误差标准，当误差小于这个标准是，我们认为相等，否则，不相等如int main()else= c");return 0;我们给出了一个判断标准，那么得到的程序运行结果为以上

Romantic_love_

108人浏览 · 2026-01-31 23:05:34

Romantic_love_ · 2026-01-31 23:05:34 发布

1.问题引入

#include <stdio.h>
int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为：%d\n", n);
 printf("*pFloat的值为：%f\n", *pFloat);
 *pFloat = 9.0;
 printf("n的值为：%d\n", n);
 printf("*pFloat的值为：%f\n", *pFloat);
 return 0;
}
//输出结果是什么呢
//依次为
9 
9.000000
9
9.000000
这个结果是对的吗?

我们发现结果与我们猜测的截然不同，那究竟是为什么呢，通过学习浮点数在内存中的存储我们就可以解决该问题。

2.浮点数的存储

上⾯的代码中， n 和 *pFloat 在内存中明明是同⼀个数，为什么浮点数和整数的解读结果会差别这么⼤？

要理解这个结果，⼀定要搞懂浮点数在计算机内部的表⽰⽅法

根据国际标准IEEE（电⽓和电⼦⼯程协会）754，任意⼀个⼆进制浮点数V可以表示成下⾯的形式： V = (−1) ^S * M * 2 ^E

1. (−1)^S 表示符号位，当S=0，V为正数；当S=1，V为负数

2. M 表示有效数字，M是⼤于等于1，⼩于2的

3. 2 ^E 表示指数位

举例来说：十进制的 5.0，写成⼆进制是 101.0 ，相当于1.01 * 2^2

那么，按照上⾯ V 的格式，可以得出S=0，M=1.01，E=2。

十进制的-5.0，写成⼆进制是 -101.0 ，相当于 -1.01 * 2^2 ；那么，S=1，M=1.01，E=2。

IEEE 754规定：对于32位的浮点数(float)，最⾼的1位存储符号位S，接着的8位存储指数E，剩下的23位存储有效数字 M

而对于64位的浮点数(double)，最⾼的1位存储符号位S，接着的11位存储指数E，剩下的52位存储有效数字M

2.1 浮点数存的过程

2.11 对有效数字M和指数E的特殊规定。

1. 对M的特殊规定

前⾯说过， 1 ≤ M < 2 ，也就是说，M可以写成 1.xxxxxx 的形式，其中 xxxxxx 表示小数部分。 IEEE 754 规定，在计算机内部保存M时，默认这个数的第⼀位总是1，因此可以被舍去，只保存后⾯的 xxxxxx部分。⽐如保存1.01的时候，只保存01，等到读取的时候，再把第⼀位的1加上去。这样做的⽬的，是节省1位有效数字。

以32位浮点数为例，留给M只有23位，将第⼀位的1舍去以后，等于可以保存24位有效数字。这样还可以提高精度

2. 对E的特殊规定

⾄于指数E，情况就⽐较复杂

⾸先，E为⼀个⽆符号整数（unsigned int）这意味着，如果E为8位，它的取值范围为0~255；如果E为11位，它的取值范围为0~2047。但是，我们知道，科学计数法中的E是可以出现负数的，

如十进制数0.5，二进制形式为0.5 ，用V的形式表示为 1.0 * 2^-1,此时E为负数

所以IEEE 754规定，存⼊内存时E的真实值必须再加上⼀个中间数

（这个中间数是以及设计好的我们可以直接使用，不用担心加上中间数后E还为负数的情况），

对于8位的E，这个中间数是127；

对于11位的E，这个中间数是1023。

⽐如，2^10的E是10，所以保存成32位浮点数时，必须保存成10+127=137，即10001001。

这样的浮点数存储⽅式很巧妙，但是我们也要注意到有的浮点数是有可能⽆法精确保存的。⽐如:1.2，我们可以在VS上调试看⼀下，我们发现会有些许误差。

由此就也可以引出，浮点数的比较大小的问题，下面会做简单介绍。

2.12 浮点数取的过程

1 .指数E从内存中取出还可以再分成三种情况

E不全为0或不全为1（常规情况）

这时，浮点数就采⽤下⾯的规则表⽰，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第⼀位的1。 ⽐如：十进制数0.5 的⼆进制形式为0.1，由于规定正数部分必须为1（科学计数法），即将⼩数点右移1位，则为1.0 * 2^-1 ，其阶码为-1+127(中间值) = 126，表⽰为01111110，⽽尾数1.0去掉整数部分为0，补⻬0到23位 00000000000000000000000，

综上，对于十进制数0.5 其⼆进制表⽰形式为:

0 01111110 00000000000000000000000

分别对应着，最高位符号位（第一位），指数（往后八位），有效数字的小数位（剩余位）的表示形式

E全为0的情况

指数位全为0，假设是对float数据的存储，那表明加上中间数127后，指数为0，那么原来的指数就为负的127 ，那么这个数将会非常小，即无限接近0，那么此时我们规定：
浮点数的指数E等于1-127（或者1-1023）即为真实值，有效数字M不再加上第⼀位的1，⽽是还原为0.xxxxxx的⼩数。这样做是为了表⽰±0，以及接近于0的很⼩的数字。

0 00000000 00100000000000000000000

E全为1 的情况

如果E全为1， 那么假如是存入float类型的数据，11111111 表示255，那么他原来的指数就为128，那么这个数将会非常大，即极限为无穷大

如果有效数字M全为0，表⽰±⽆穷⼤（正负取决于符号位s）；

0 11111111 00010000000000000000000

以上就是浮点数的表示规则。

3.问题回溯讲解

有了上数浮点数的表示规则的学习，我们就可以解决刚开始的疑惑了

int main()
{
	int n = 9;
	float* pFloat = (float*)&n; 
	printf("n的值为：%d\n", n); //9

    //9的补码 ：0 0000000 000000000000000000001001
	//         则0 表示符号位，因为E全为0，这是特殊情况，我们规定E为 1-127 = -126
	//故浮点数V = -1^0 * 0.00000000000000000001001*2^-126 = 1.001*2^-146 
	//无限接近于+0；故打印出0.000000

	printf("*pFloat的值为：%f\n", *pFloat);//0.000000

	*pFloat = 9.0;

    //9.0写成二进制形式为1001.0 写成V的形式为 （-1）^S * 1.001 * 2^3,则S = 0，E = 3， M = 1.001
    其中E要加上中间数127等于130，M只把小数部分存入内存中
    则9.0在内存中的表示形式为：0 10000010 00100000000000000000000，
    这个数用十进制表示，就是1091567616

	printf("n的值为：%d\n", n);//1091567616
	printf("*pFloat的值为：%f\n", *pFloat);//9.000000
	return 0;
}

4.浮点数的误差问题（简单介绍）

int main()
{
	double a = 0.1;
	double b = 0.2;
	double c = 0.3;
	if (a + b == c)
		printf("a + b == c");
	else
		printf("a + b != c");
    return 0；
}

如果纯靠数学思维来思考，那我们自然认为a+b == c，但是通过上面的学习，我们发现有些浮点数其实并不能准确的表示，如图

所以程序中的打印结果也并不是，a+b == c

而是

所以需要换一个判断标准，

我们一般会规定一个误差标准，当误差小于这个标准是，我们认为相等，否则，不相等

如

int main()
{
	double a = 0.1;
	double b = 0.2;
	double c = 0.3;
	if ((a + b - c) < 0.000001)
		printf("a + b == c");
	else
		printf("a + b != c");


	return 0;
}

我们给出了一个判断标准，那么得到的程序运行结果为

以上就是关于浮点数问题的简单介绍

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

ImagineNav++：通过场景想象激发视觉语言模型，使其成为具身导航器

2048 AI社区

Flutter for OpenHarmony 实战：疯狂头像 App（四）— 通义万相 AIGC 联调与相册持久化实战

2048 AI社区

【Mysql基础（二）】函数、约束、多表查询与事务

外键约束（Foreign Key Constraint）是关系型数据库中用于维护表间引用完整性的机制。它确保一个表（子表）中的列值必须匹配另一个表（父表）中的主键或唯一键值，从而建立表间的关联关系。事务是数据库操作的最小逻辑单元，保证一组操作要么全部成功，要么全部失败。MySQL 支持事务的存储引擎包括 InnoDB 和 NDB，而 MyISAM 不支持事务。），每条 SQL 语句作为一个独立事务