float类型和double类型的二进制存储
在32位环境下,float占用32位,double占用64位,
目前C/C++编译器标准都遵照IEEE制定的浮点数表示法来进行float,double运算。这种结构是一种科学计数法,用符号、指数和
尾数来表示,底数定为2——即把一个浮点数表示为尾数乘以2的指数次方再添上符号。下面是具体的规格:
符号位阶码尾数长度
float            1          8        23      32
double      1            11        52      64
例如:
按照IEEE浮点数表示法,下面将把double型浮点数38414.4转换为十六进制代码。
把整数部和小数部分开处理:整数部直接化十六进制:960E。小数的处理:
0.4=0.5*0+0.25*1+0.125*1+0.0625*0+……
实际上这永远算不完!这就是著名的浮点数精度问题。所以直到加上前面的整数部分算够53位就行了(隐藏位技术:最高位的1不写入内存)。
如果你够耐心,手工算到53位那么因该是:
38414.4(10)=1001011000001110.0110101010101010101010101010101010101(2)
科学记数法为:1.001……乘以2的15次方。指数为15!
于是来看阶码,一共11位,可以表示范围是-1024~1023。因为指数可以为负,为了便于计算,规定都先加上1023,在这里,15+1023=1038。二进制表示为:100  00001110  符号位:正——0  !
合在一起(尾数二进制最高位的1不要):
01000000  11100010  11000001  11001101  01010101  01010101  01010101  01 010101
按字节倒序存储的十六进制数就是:
55  55  55  55  CD  C1  E2  40
另一个例子:
将100分别转化为float型:
100=(1+1/2+1/16)*2^6
转为float型为
100为正数,符号位为0,
阶码,一共8位,因为指数可以为负,为了便于计算,规定都先加上127,在这里6+127=133转为二进制为10000101
尾数转为1.1001,因为最高位的1 不写入内存,则尾数转为23位二进制为10010000000000000000000
合在一起就是01000010110010000000000000000000
转为double型为
100为正数,符号位为0,
阶码,一共11位,因为指数可以为负,为了便于计算,规定都先加上1023,在这里
6+1023=1029转为二进制为10000000101
尾数转为1.1001,因为最高位的1 不写入内存,则尾数转为52位二进制为1001000000000000000000000000000000000000000000000000
合在一起就是0100000001011001000000000000000000000000000000000000000000000000
将float转为二进制字符串
[cpp]view plainc opy
1.//str should have at least 33 byte.
2.void floattostr(float* a, char* str){
3.    unsigned int c;
4.    c= ((unsigned int*)a)[0];
5.for(int i=0;i<32;i++){
6.        str[31-i]=(char)(c&1)+'0';
float型
7.        c>>=1;
8.    }
9.    str[32] = '\0';
10.}
将double转为二进制字符串
[cpp]view plainc opy
1.//str should have at least 64 byte.
2.void doubletostr(double* a, char* str){
3.long long c;
4.    c= ((long long*)a)[0];
5.for(int i=0;i<64;i++){
6.        str[63-i]=(char)(c&1)+'0';
7.        c>>=1;
8.    }
9.    str[64] = '\0';
将32位二进制字符串转为float
[cpp]view plainc opy
1.float strtofloat(char * str){
2.    unsigned int flt = 0;
3.for(int i=0;i<31;i++){
4.        flt += (str[i]-'0');
5.        flt <<= 1;
6.    }
7.    dbl += (str[31]-'0');
8.float * ret = (float*)&flt;
10.}
将64位二进制字符串转为double
[cpp]view plainc opy
1.double strtodbl(char * str){
2.long long dbl = 0;
3.for(int i=0;i<63;i++){
4.        dbl += (str[i]-'0');
5.        dbl <<= 1;
6.    }
7.    dbl +=(str[63]-'0');
8.double* db = (double*)&dbl;
10.}