第3章  DSP芯片的定点运算
3.1  数 的 定 标
在定点DSP芯片中,采用定点数进行数值运算,其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP芯片所给定的字长,一般为16位或24位。显然,字长越长,所能表示的数的范围越大,精度也越高。如无特别说明,本书均以16位字长为例。
DSP芯片的数以2的补码形式表示。每个16位数用一个符号位来表示数的正负,0表示数值为正,1则表示数值为负。其余15位表示数值的大小。因此
二进制数0010000000000011b=8195
二进制数1111111111111100b=-4
对DSP芯片而言,参与数值运算的数就是16位的整型数。但在许多情况下,数学运算过程中的数不一定都是整数。那么,DSP芯片是如何处理小数的呢?应该说,DSP芯片本身无能为力。那么是不是说DSP芯片就不能处理各种小数呢?当然不是。这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。
通过设定小数点在16位数中的不同位置,就可以表示不同大小和不同精度的小数了。数的定标有Q表示法和S表示法两种。表3.1列出了一个16位数的16种Q表示、S表示及它们所能表示的十进制数值范围。
从表3.1可以看出,同样一个16位数,若小数点设定的位置不同,它所表示的数也就不同。例如:
16进制数2000H=8192,用Q0表示
16进制数2000H=0.25,用Q15表示
但对于DSP芯片来说,处理方法是完全相同的。
从表3.1还可以看出,不同的Q所表示的数不仅范围不同,而且精度也不相同。Q越大,数值范围越小,但精度越高;相反,Q越小,数值范围越大,但精度就越低。例如,Q0的数值范围是-32768到+32767,其精度为1,而Q15的数值范围为-1到0.9999695,精度为 1/32768 = 0.00003051。因此,对定点数而言,数值范围与精度是一对矛盾,一个变量要想能够表示比较大的数值范围,必须以牺牲精度为代价;而想提高精度,则数的表示范围就相应地减小。
在实际的定点算法中,为了达到最佳的性能,必须充分考虑到这一点。
浮点数与定点数的转换关系可表示为:
浮点数(x)转换为定点数():
定点数()转换为浮点数(x):
如,浮点数 x=0.5,定标 Q15,则定点数,式中表示下取整。反之,一个用 Q15 表示的定点数16384,其浮点数为16384×2-15
=16384/32768=0.5。

表3.1  Q表示、S表示及数值范围
Q表示
S表示
十进制数表示范围
Q15
S0.15
-1X0.9999695
Q14
S1.14
-2X1.9999390
Q13
S2.13
-4X3.9998779
Q12
S3.12
-8X7.9997559
Q11
S4.11
-16X15.9995117
Q10
S5.10
-32X31.9990234
Q9
S6.9
-64X63.9980469
Q8
S7.8
-128X127.9960938
Q7
S8.7
-256X255.9921875
Q6
S9.6
-512X511.9804375
Q5
S10.5
-1024X1023.96875
Q4
S11.4
-2048X2047.9375
Q3
S12.3
-4096X4095.875
Q2
S13.2
-8192X8191.75
Q1
S14.1
-16384X16383.5
Q0
S15.0
-32768X32767
3.2  高级语言:从浮点到定点
在编写DSP模拟算法时,为了方便,一般都是采用高级语言(如C语言)来编写模拟程序。程序中所用的变量一般既有整型数,又有浮点数。如例3.1程序中的变量i是整型数,而pi是浮点数,hamwindow则是浮点数组。
3.1  256点汉明窗计算
int    i;
float    pi=3.14159;
float    hamwindow[256];
for(i=0;i<256;i++)  hamwindow[i]=0.54-0.46*cos(2.0*pi*i/255);
如果要将上述程序用某种定点DSP芯片来实现,则需将上述程序改写为DSP芯片的汇编语言程序。为了DSP程序调试的方便及模拟定点DSP实现时的算法性能,在编写DSP汇编程序之前一般需将高级语言浮点算法改写为高级语言定点算法。下面讨论基本算术运算的定点实现
方法。
3.2.1  加法/减法运算的C语言定点模拟
设浮点加法运算的表达式为:
float数值范围float x,y,z;
z=x+y;
将浮点加法/减法转化为定点加法/减法时最重要的一点就是必须保证两个操作数的定标值一样。若两者不一样,则在做加法/减法运算前先进行小数点的调整。为保证运算精度,需使Q值小的数调整为与另一个数的Q值一样大。此外,在做加法/减法运算时,必须注意结果可能会超过16位表示。如果加法/减法的结果超出16位的表示范围,则必须保留32位结果,以保证运算的精度。
1.结果不超过16位表示范围
设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加法/减法结果z的定标值为Qz,则
z=x+y 
=   
= 
所以定点加法可以描述为:
int x,y,z;
long temp;    /*临时变量*/
temp=y<<(Qx-Qy);
temp=x+temp;
z=(int)(temp>>(Qx-Qz)), 若QxQz
z=(int)(temp<<(Qz-Qx)), 若QxQz
3.2  定点加法
设x=0.5,y=3.1,则浮点运算结果为z=x+y=0.5+3.1=3.6;
Qx=15,Qy=13,Qz=13,则定点加法为:
x=16384;y=25395;
temp=25395<<2=101580;
temp=x+temp=16384+101580=117964;
z=(int)(117964L>>2)=29491;
因为z的Q值为13,所以定点值z=29491即为浮点值z=29491/8192=3.6。
3.3  定点减法
设x=3.0,y=3.1,则浮点运算结果为z=x-y=3.0-3.1=-0.1;
Qx=13,Qy=13,Qz=15,则定点减法为:
x=24576;y=25295;
temp=25395;
temp=x-temp=24576-25395=-819;
因为Qx<Qz,故 z=(int)(-819<<2)=-3276。由于z的Q值为15,所以定点值z=-3276即为浮点值z=-3276/32768-0.1。
2.结果超过16位表示范围
设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加法结果z的定标值为Qz,则定点加法为:
int x,y;
long temp,z;
temp=y<<(Qx-Qy);
temp=x+temp;
z=temp>>(Qx-Qz),若QxQz
z=temp<<(Qz-Qx),若QxQz
3.4  结果超过16位的定点加法
设x=15000,y=20000,则浮点运算值为z=x+y=35000,显然z>32767,因此
Qx=1,Qy=0,Qz=0,则定点加法为:
x=30000;y=20000;
temp=20000<<1=40000;
temp=temp+x=40000+30000=70000;
z=70000L>>1=35000;
因为z的Q值为0,所以定点值z=35000就是浮点值,这里z是一个长整型数。
当加法或加法的结果超过16位表示范围时,如果程序员事先能够了解到这种情况,并且需要保证运算精度时,则必须保持32位结果。如果程序中是按照16位数进行运算的,则超过16位实际上就是出现了溢出。如果不采取适当的措施,则数据溢出会导致运算精度的严重恶化。一般的定点DSP芯片都设有溢出保护功能,当溢出保护功能有效时,一旦出现溢出,则累加器ACC的结果为最大的饱和值(上溢为7FFFH,下溢为8001H),从而达到防止溢出引起精度严重恶化的目的。
3.2.2  乘法运算的C语言定点模拟
设浮点乘法运算的表达式为:
float x,y,z;
z = xy;
假设经过统计后x的定标值为Qx,y的定标值为Qy,乘积z的定标值为Qz,则
z = xy
=
=
所以定点表示的乘法为:
int x,y,z;
long temp;
temp = (long)x;
z = (temp×y) >> (Qx+Qy-Qz);
3.5  定点乘法
设x = 18.4,y = 36.8,则浮点运算值为z =18.4×36.8 = 677.12;
根据上节,得Qx = 10,Qy = 9,Qz = 5,所以
x = 18841;y = 18841;
temp = 18841L;
z = (18841L*18841)>>(10+9-5) = 354983281L>>14 = 21666;
因为z的定标值为5,故定点 z = 21666即为浮点的 z = 21666/32 = 677.08。
3.2.3  除法运算的C语言定点模拟
设浮点除法运算的表达式为:
float x,y,z;
z = x/y;
假设经过统计后被除数x的定标值为Qx,除数y的定标值为Qy,商z的定标值为Qz,则
z = x/y
=  
所以定点表示的除法为:
int x,y,z;
long temp;
temp = (long)x;
z = (temp<<(Qz-Qx+Qy))/y;
3.6  定点除法
设x = 18.4,y = 36.8,浮点运算值为z = x/y = 18.4/36.8 = 0.5;
根据上节,得Qx = 10,Qy = 9,Qz = 15;所以有
x = 18841, y = 18841;
temp = (long)18841;
z = (18841L<<(15-10+9))/18841 = 308690944L/18841 = 16384;
因为商z的定标值为15,所以定点z = 16384即为浮点 z = 16384/215= 0.5。
3.2.4  程序变量的Q值确定
在前面几节介绍的例子中,由于x、y、z的值都是已知的,因此从浮点变为定点时Q值很好确定。在实际的DSP应用中,程序中参与运算的都是变量,那么如何确定浮点程序中变量的Q值呢?
从前面的分析可以知道,确定变量的Q值实际上就是确定变量的动态范围,动态范围确定了,则Q值也就确定了。
设变量的绝对值的最大值为,注意必须小于或等于32767。取一个整数n,使它满足
则有
Q = 15-n
例如,某变量的值在-1至+1之间,即<1,因此n = 0,Q=15-n = 15。