定点数与浮点数--688IT编程网

第3章 DSP芯片的定点运算

3.1 数的定标

在定点DSP芯片中，采用定点数进行数值运算，其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP芯片所给定的字长，一般为16位或24位。显然，字长越长，所能表示的数的范围越大，精度也越高。如无特别说明，本书均以16位字长为例。

DSP芯片的数以2的补码形式表示。每个16位数用一个符号位来表示数的正负，0表示数值为正，1则表示数值为负。其余15位表示数值的大小。因此

二进制数0010000000000011b＝8195

二进制数1111111111111100b＝-4

对DSP芯片而言，参与数值运算的数就是16位的整型数。但在许多情况下，数学运算过程中的数不一定都是整数。那么，DSP芯片是如何处理小数的呢？应该说，DSP芯片本身无能为力。那么是不是说DSP芯片就不能处理各种小数呢？当然不是。这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。

通过设定小数点在16位数中的不同位置，就可以表示不同大小和不同精度的小数了。数的定标有Q表示法和S表示法两种。表3.1列出了一个16位数的16种Q表示、S表示及它们所能表示的十进制数值范围。

从表3.1可以看出，同样一个16位数，若小数点设定的位置不同，它所表示的数也就不同。例如：

16进制数2000H＝8192，用Q0表示

16进制数2000H＝0.25，用Q15表示

但对于DSP芯片来说，处理方法是完全相同的。

从表3.1还可以看出，不同的Q所表示的数不仅范围不同，而且精度也不相同。Q越大，数值范围越小，但精度越高；相反，Q越小，数值范围越大，但精度就越低。例如，Q0的数值范围是-32768到+32767，其精度为1，而Q15的数值范围为-1到0.9999695，精度为 1/32768 = 0.00003051。因此，对定点数而言，数值范围与精度是一对矛盾，一个变量要想能够表示比较大的数值范围，必须以牺牲精度为代价；而想提高精度，则数的表示范围就相应地减小。

在实际的定点算法中，为了达到最佳的性能，必须充分考虑到这一点。

浮点数与定点数的转换关系可表示为：

浮点数(x)转换为定点数()：

定点数()转换为浮点数(x)：

例如，浮点数 x=0.5，定标 Q＝15，则定点数＝，式中表示下取整。反之，一个用 Q＝15 表示的定点数16384，其浮点数为16384×2-15

＝16384/32768=0.5。

表3.1 Q表示、S表示及数值范围

Q表示	S表示	十进制数表示范围
Q15	S0.15	-1≤X≤0.9999695
Q14	S1.14	-2≤X≤1.9999390
Q13	S2.13	-4≤X≤3.9998779
Q12	S3.12	-8≤X≤7.9997559
Q11	S4.11	-16≤X≤15.9995117
Q10	S5.10	-32≤X≤31.9990234
Q9	S6.9	-64≤X≤63.9980469
Q8	S7.8	-128≤X≤127.9960938
Q7	S8.7	-256≤X≤255.9921875
Q6	S9.6	-512≤X≤511.9804375
Q5	S10.5	-1024≤X≤1023.96875
Q4	S11.4	-2048≤X≤2047.9375
Q3	S12.3	-4096≤X≤4095.875
Q2	S13.2	-8192≤X≤8191.75
Q1	S14.1	-16384≤X≤16383.5
Q0	S15.0	-32768≤X≤32767

3.2 高级语言：从浮点到定点

在编写DSP模拟算法时，为了方便，一般都是采用高级语言(如C语言)来编写模拟程序。程序中所用的变量一般既有整型数，又有浮点数。如例3.1程序中的变量i是整型数，而pi是浮点数，hamwindow则是浮点数组。

例3.1 256点汉明窗计算

int i;

float pi=3.14159;

float hamwindow[256];

for(i=0;i<256;i++) hamwindow[i]=0.54-0.46*cos(2.0*pi*i/255);

如果要将上述程序用某种定点DSP芯片来实现，则需将上述程序改写为DSP芯片的汇编语言程序。为了DSP程序调试的方便及模拟定点DSP实现时的算法性能，在编写DSP汇编程序之前一般需将高级语言浮点算法改写为高级语言定点算法。下面讨论基本算术运算的定点实现

方法。

3.2.1 加法/减法运算的C语言定点模拟

设浮点加法运算的表达式为：

float数值范围float x,y,z;

z=x+y;

将浮点加法/减法转化为定点加法/减法时最重要的一点就是必须保证两个操作数的定标值一样。若两者不一样，则在做加法/减法运算前先进行小数点的调整。为保证运算精度，需使Q值小的数调整为与另一个数的Q值一样大。此外，在做加法/减法运算时，必须注意结果可能会超过16位表示。如果加法/减法的结果超出16位的表示范围，则必须保留32位结果，以保证运算的精度。

1．结果不超过16位表示范围

设x的Q值为Qx，y的Q值为Qy，且Qx>Qy，加法/减法结果z的定标值为Qz，则

z＝x+y

所以定点加法可以描述为：

int x,y,z;

long temp; /*临时变量*/

temp＝y<<(Qx－Qy);

temp＝x＋temp;

z＝(int)(temp>>(Qx－Qz)), 若Qx≥Qz

z＝(int)(temp<<(Qz－Qx)), 若QxQ≤z

例3.2 定点加法

设x＝0.5，y＝3.1，则浮点运算结果为z＝x+y＝0.5+3.1＝3.6;

Qx＝15，Qy＝13，Qz＝13，则定点加法为：

x＝16384；y＝25395;

temp＝25395<<2＝101580;

temp＝x+temp＝16384+101580＝117964;

z＝(int)(117964L>>2)＝29491;

因为z的Q值为13，所以定点值z＝29491即为浮点值z＝29491/8192＝3.6。

例3.3 定点减法

设x＝3.0，y＝3.1，则浮点运算结果为z＝x-y＝3.0-3.1＝-0.1;

Qx＝13，Qy＝13，Qz＝15，则定点减法为：

x＝24576；y＝25295；

temp＝25395;

temp＝x-temp＝24576-25395＝-819;

因为Qx<Qz，故 z＝(int)(-819<<2)＝-3276。由于z的Q值为15，所以定点值z＝-3276即为浮点值z＝-3276/32768-0.1。

2．结果超过16位表示范围

设x的Q值为Qx，y的Q值为Qy，且Qx>Qy，加法结果z的定标值为Qz,则定点加法为：

int x，y；

long temp，z；

temp＝y<<(Qx-Qy)；

temp＝x＋temp;

z＝temp>>(Qx-Qz)，若Qx≥Qz

z＝temp<<(Qz-Qx)，若Qx≤Qz

例3.4 结果超过16位的定点加法

设x＝15000，y＝20000，则浮点运算值为z＝x＋y＝35000，显然z>32767，因此

Qx＝1，Qy＝0，Qz＝0，则定点加法为：

x＝30000；y＝20000；

temp＝20000<<1＝40000;

temp＝temp+x＝40000+30000＝70000;

z＝70000L>>1＝35000;

因为z的Q值为0，所以定点值z=35000就是浮点值，这里z是一个长整型数。

当加法或加法的结果超过16位表示范围时，如果程序员事先能够了解到这种情况，并且需要保证运算精度时，则必须保持32位结果。如果程序中是按照16位数进行运算的，则超过16位实际上就是出现了溢出。如果不采取适当的措施，则数据溢出会导致运算精度的严重恶化。一般的定点DSP芯片都设有溢出保护功能，当溢出保护功能有效时，一旦出现溢出，则累加器ACC的结果为最大的饱和值(上溢为7FFFH，下溢为8001H)，从而达到防止溢出引起精度严重恶化的目的。

3.2.2 乘法运算的C语言定点模拟

设浮点乘法运算的表达式为：

float x,y,z;

z = xy;

假设经过统计后x的定标值为Qx，y的定标值为Qy，乘积z的定标值为Qz，则

z = xy

所以定点表示的乘法为：

int x,y,z;

long temp;

temp = (long)x;

z = (temp×y) >> (Qx+Qy-Qz);

例3.5 定点乘法

设x = 18.4，y = 36.8，则浮点运算值为z =18.4×36.8 = 677.12;

根据上节，得Qx = 10，Qy = 9，Qz = 5，所以

x = 18841；y = 18841；

temp = 18841L;

z = (18841L*18841)>>(10+9-5) = 354983281L>>14 = 21666;

因为z的定标值为5，故定点 z = 21666即为浮点的 z = 21666/32 = 677.08。

3.2.3 除法运算的C语言定点模拟

设浮点除法运算的表达式为：

float x,y,z;

z = x/y;

假设经过统计后被除数x的定标值为Qx，除数y的定标值为Qy，商z的定标值为Qz，则

z = x/y

所以定点表示的除法为：

int x,y,z;

long temp;

temp = (long)x;

z = (temp<<(Qz-Qx+Qy))/y;

例3.6 定点除法

设x = 18.4，y = 36.8，浮点运算值为z = x/y = 18.4/36.8 = 0.5;

根据上节，得Qx = 10，Qy = 9，Qz = 15；所以有

x = 18841, y = 18841;

temp = (long)18841;

z = (18841L<<(15-10+9))/18841 = 308690944L/18841 = 16384;

因为商z的定标值为15，所以定点z = 16384即为浮点 z = 16384/215= 0.5。

3.2.4 程序变量的Q值确定

在前面几节介绍的例子中，由于x、y、z的值都是已知的，因此从浮点变为定点时Q值很好确定。在实际的DSP应用中，程序中参与运算的都是变量，那么如何确定浮点程序中变量的Q值呢？

从前面的分析可以知道，确定变量的Q值实际上就是确定变量的动态范围，动态范围确定了，则Q值也就确定了。

设变量的绝对值的最大值为，注意必须小于或等于32767。取一个整数n，使它满足

则有

Q = 15-n

例如，某变量的值在-1至＋1之间，即<1，因此n = 0，Q＝15-n = 15。

688IT编程网

定点数与浮点数

发表评论

推荐文章

写一封上大学后给父母的信英语作文

想加入爬山俱乐部英语作文高中

club的英语作文模板四年级

my club的英语作文

拯救树木俱乐部英语作文80词

热门文章

描写学校社团活动英语作文

七下作文英语10篇学校俱乐部

外国网友在中国开设汉字俱乐部英语作文

邀请交换生参加京剧俱乐部的英语作文

申请加入京剧俱乐部作文英语

申请高一英语阅读社团英语作文

王朝霞英语试卷六年级知识盘点彩页

2011年专业英语四级真题试卷(题后含答案及解析)

2022年湖南省邵阳市普通高校对口单招英语二模测试卷(含答案)

myfavoriteclub英语作文小学

玩转高考题—2021新高考全国II卷C篇阅读二次开发(学生版)

新标准大学英语视听说2(听力材料文本1-10及listening答案1-6)_百度文 ...

My School Club

关于club的英语作文初一下册

象棋俱乐部作文英语带翻译

英语俱乐部开展电影周活动英语作文

阅读俱乐部原版英文作文

邀请别人加入俱乐部英语作文

club作文80词

国际象棋俱乐部英语作文

最新文章

想加入爬山俱乐部英语作文高中

club的英语作文模板四年级

my club的英语作文

街舞俱乐部招新英语作文初一

加入读书俱乐部的英语作文初一短

汤姆想要加入英语俱乐部的英语作文

标签列表

688IT编程网

定点数与浮点数

发表评论

推荐文章

写一封上大学后给父母的信英语作文

想加入爬山俱乐部英语作文 高中

club的英语作文模板四年级

my club的英语作文

拯救树木俱乐部英语作文80词

热门文章

描写学校社团活动英语作文

七下作文英语10篇学校俱乐部

外国网友在中国开设汉字俱乐部英语作文

邀请交换生参加京剧俱乐部的英语作文

申请加入京剧俱乐部作文英语

申请高一英语阅读社团英语作文

王朝霞英语试卷六年级知识盘点彩页

2011年专业英语四级真题试卷(题后含答案及解析)

2022年湖南省邵阳市普通高校对口单招英语二模测试卷(含答案)

myfavoriteclub英语作文小学

玩转高考题—2021新高考全国II卷C篇阅读二次开发(学生版)

新标准大学英语视听说2(听力材料文本1-10及listening答案1-6)_百度文 ...

My School Club

关于club的英语作文初一下册

象棋俱乐部作文英语带翻译

英语俱乐部开展电影周活动英语作文

阅读俱乐部原版英文作文

邀请别人加入俱乐部英语作文

club作文80词

国际象棋俱乐部英语作文

最新文章

想加入爬山俱乐部英语作文 高中

club的英语作文模板四年级

my club的英语作文

街舞俱乐部招新英语作文初一

加入读书俱乐部的英语作文初一短

汤姆想要加入英语俱乐部的英语作文

标签列表

想加入爬山俱乐部英语作文高中

想加入爬山俱乐部英语作文高中