浮点数的运算为什么更慢--688IT编程网

浮点数的运算为什么更慢

1. 浮点数的表⽰

m 是尾数，为±d.dddddd 其中第⼀位必须⾮0

b 是基数，

下⾯，让我们回到⼀开始的问题：为什么0x00000009还原成浮点数，就成了0.000000？

⾸先，将0x00000009拆分，得到第⼀位符号位s=0，后⾯8位的指数E=00000000，最后23位的有效数字M=000 0000 0000 0000 0000 1001。

由于指数E全为0，所以符合上⼀节的第⼆种情况。因此，浮点数V就写成：

V=(-1)^0×0.00000000000000000001001×2^(-126)=1.001×2^(-146)

结论

通⽤规则：

整数和（和AND/ OR/ XOR）与乘积花费的时间相同，除法（和取模）的速度倍。

浮点数的乘积⽐求和的乘积慢两倍，除法的乘积甚⾄更慢。

在相同数据⼤⼩下，浮点运算始终⽐整数运算慢。

越⼩越快。

64位整数精度确实很慢。

浮点数32位总和⽐64位快，但在乘积和除法上却不是。

80和128位精度仅在绝对必要时才应使⽤，它们⾮常慢。

特别案例：

在x86-64 AVX上，浮点乘积在64位数据上⽐在32位上更快。

在POWER8 AltiVec上，浮点乘积以各种精度达到求和的速度。对8位，16位，32位或64位整数以相同的速度执⾏整数运算。

在ARM1176上，按位整数运算符⽐加法运算要快。

⽰例代码：

#include <stdio.h>

#include <math.h>

#include <stdlib.h>

#include <cv/cv_tools.h>

#include <picture/cv_picture.h>

#include "libyuv.h"

using namespace cv;

using namespace std;

using namespace oop;

int main()

{

const int N= 10000;

int sum = 0;

float sumf = 0;

float nf = 734.0f;

int n = 734;

timeInit;

timeMark("int");

for(int j=0;j!=100000;++j)

{

sum = 0;

for (int i = 0; i != N; ++i) {

sum += n;

}

timeMark("float");

for (int j = 0; j != 100000; ++j)

{

sumf = 0;

for (int i = 0; i != N; ++i) {

sumf += nf;

}

timeMark(")");

timePrint;

printf("sum=%d\nsumf=%.2f\n",sum,sumf);

getchar();

}

输出：

( int,float ) : 2107 ms

( float,) ) : 3951 ms

sum=7340000

sumf=7340000.00

Release：

( int,float ) : 0 ms

( float,) ) : 1814 ms

sum=7340000

sumf=7340000.00

实际上： Debug模式下，两者时间差不了多少，两倍的关系

但是Release模式下， int ⼏乎很快就完成了！！说明int型被优化得很好了，float型运算不容易被编译器优化！！！

我们在Release模式下，优化设置为O2, 连接器设置为-优化以便于调试

查看int 乘法汇编指令：xmm0 表⽰128位的SSE寄存器，可见我们的代码都被优化为SSE指令了！！

查看float 汇编代码：

感觉⾥⾯也有xmm 等SSE指令集，⾄于为啥int型乘法⽐float乘法快很多，还是有点搞不明⽩，需要详细分析⾥⾯的汇编指令才能搞明⽩⽹上关于这⽅⾯的资料太少了，哎~~

我们再看看float 和 int乘法对图像进⾏处理的例⼦：

我们把BGR 3个通道分别乘以2 3 4 、 2.0f, 3.0f, 4.0f 然后输出，这⾥我们不考虑溢出的问题，仅仅对乘法的效率进⾏测试

设置为Release模式，O2

int main()

{

cv::Mat src = imread("D:/pic/nlm.jpg");

//cvtColor(src,src,CV_BGR2GRAY);

resize(src,src,Size(3840*2,2160*2));

cv::Mat dst0(src.size(), pe());

cv::Mat dst1(src.size(), pe());

int w = ls;

int h = ws;

int of3=0;

timeInit;

timeMark("int");

for (int j = 0; j != h; ++j) {

for (int i = 0; i != w; ++i) {

//int of3 = (j*w + i) * 3;

dst0.data[of3 ] = src.data[of3] * 2;

dst0.data[of3 + 1] = src.data[of3 + 1] * 3;

dst0.data[of3 + 2] = src.data[of3 + 2] * 4;

of3+=3;

}

timeMark("float");

of3=0;

for (int j = 0; j != h; ++j) {

for (int i = 0; i != w; ++i) {

//int of3 = (j*w + i)*3;

dst1.data[of3] = src.data[of3] * 2.0f;

dst1.data[of3+1] = src.data[of3+1] * 3.0f;

dst1.data[of3+2] = src.data[of3+2] * 4.0f;

of3 += 3;

}

timeMark("end");

timePrint;

myShow(dst0);

myShow(dst1);

waitKey(0);

}

输出：

( int,float ) : 149 ms

( float,end ) : 173 ms

输出图像（分别为原图，dst0，dst1）（截取了⼀部分）

可见，时间并差不了多少，但int还是要快⼀点！！float型

这是我看到的另外⼀个帖⼦，⾥⾯讲的float乘法确实⽐较复杂，这可能是它⽐较慢的原因之⼀吧

总结⼀下： float运算更慢的原因：

1. float运算不容易被编译器优化

2. float运算本⾝就慢（但并不⽐int型运算慢多少，⼤约1.3-2倍的样⼦）

688IT编程网

浮点数的运算为什么更慢

发表评论

推荐文章

emo是什么意思

东风化雨是什么意思

英语作文20年后的我有汉语意思女生版

英语文学导论诗歌意象

英语中各种词性的意义及用法

热门文章

24节气及其代表的含义

常见女生英文名含义

成功作文之成功意味着什么英语作文

常用女性英文名及其含义

2020年英语SUMMER中文意思

spa是什么意思

ioc是什么意思的英文缩写

sde的基本概念 -回复

两种意思的英语单词

pickup的意思有十几种,你相信吗

潮汐表字母含义

潮汛的意思是什么

很多哲学家比如德里达,所说的“在场”是什么意思?

?遍地开花什么意思?有什么典故?

参考文献的类型及字母含义

文献后缀的意思

参考文献的各种字母的含义

英语中肯定形式表否定意义的几种表达

文献类型标示及含义([M]、[J])

英文名的含义

最新文章

东风化雨是什么意思

英语作文20年后的我有汉语意思女生版

SpringBoot遇到的坑@Qualifier报红的解决

有意思的春联10句

五一敦煌游记作文【高中高二5800字】

钢结构英文缩写及含义

标签列表