java中补码怎么计算,⼆进制中补码计算简单详实的讲解
本⽂说明⼀个基本的问题,补码的问题。
需要说明⼀点补码是对负整数在计算机中存储的⼀种形式;另⼀种形式是负数在计算机中可以⽤符号+负数绝对值的形式表⽰⼀个负数;⽐如(-3: 1000 0011存储)但是这种表⽰的负数有两个零+0,-0,最要命的⼀点是不能做算术运算。⽐如10-3=10+(-3)=0000 1010+ 1000 0011=1000 1101=-13显然是错的。所以负整数必须以补码存储。
负数在计算机中如何表⽰?
举例来说,+8在计算机中表⽰为⼆进制的1000,那么-8怎么表⽰呢?
很容易想到,可以将⼀个⼆进制位(bit)专门规定为符号位,它等于0时就表⽰正数,等于1时就表⽰负数。⽐如,在8位机中,规定每个字节的最⾼位为符号位。那么,+8就是00001000,⽽-8则是10001000。
补码的最小负数
但是,随便⼀本《计算机原理》,都会告诉你,实际上,计算机内部采⽤2的补码(Two’s Complement)表⽰负数。
在讲补码之前简单介绍机器数,真值,原码和反码的背景。
1、机器数
⼀个数在计算机中的⼆进制表⽰形式,  叫做这个数的机器数。机器数是带符号的,在计算机⽤⼀个数的最⾼位存放符号, 正数0,负数为1。
1
⽐如,⼗进制中的数 +3 ,计算机字长为8位,转换成⼆进制就是0000 0011。如果是 -3 ,就是 1111 1101 。那么,这⾥的00000011 和 1111 1101 就是机器数。 机器数包含了符号和数值部分。
2、真值
因为第⼀位是符号位,所以机器数的形式值就不能很好的表⽰真正的数值。例如上⾯的有符号数 1111 1101,其最⾼位1代表负,其真正数值是 -3 ⽽不是形式值253(1111 1101按⽆符号整数转换成⼗进制等于253)。所以,为区别起见,将带符号位的机器数对应的真正数值称为机器数的真值。
例:0000 0001的真值 = +000 0001 = +1,1000 0001的真值 = –0111 1111 = –127;这⾥所说的⽐如-3⼆进制代码为10000011,就是我们计算机⾥⾯对-3表⽰的源码。下⾯介绍源码
⾸先说明⼀点
在计算机内,有符号数有3种表⽰法:原码、反码和补码。
3、原码
原码就是符号位加上真值的绝对值, 即⽤第⼀位表⽰符号, 其余位表⽰值. ⽐如如果是8位⼆进制
[+1]原 = 0000 0001
[-1]原 = 1000 0001
因为第⼀位是符号位, 所以若是8位⼆进制数,其取值范围就是:
[1111 1111 , 0111 1111]
即[-127 , 127]
原码是⼈脑最容易理解和计算的表⽰⽅式。
4 、反码
反码表⽰法规定:正数的反码与其原码相同;负数的反码是对其原码逐位取反,但符号位除外。
[+1] = [ 00000001 ]原码 = [ 00000001 ]反码;
[-1] = [ 10000001 ]原码 = [ 11111110 ]反码;
可见如果⼀个反码表⽰的是负数, ⼈脑⽆法直观的看出来它的数值. 通常要将其转换成原码再计算。
什么是⼆进制的补码?
注明:正数的补码与负数的补码⼀致,负数的补码符号位为1,这位1即是符号位也是数值位,然后加1
补码借鉴的模概念,虽然理解起来有点晦涩难懂。可以跳过
模的概念:把⼀个计量单位称之为模或模数。例如,时钟是以12进制进⾏计数循环的,即以12为模。
在时钟上,时针加上(正拨)12的整数位或减去(反拨)12的整数位,时针的位置不变。14点钟在舍去模12后,成为(下午)2点钟(14=14-
12=2)。从0点出发逆时针拨10格即减去10⼩时,也可看成从0点出发顺时针拨2格(加上2⼩时),即2点(0-10=-10=-10+12=2)。因此,在模12的前提下,-10可映射为+2。由此可见,对于⼀个模数为12的循环系统来说,加2和减10的效果是⼀样的;因此,在以12为模的系统中,凡是减10的运算都可以⽤加2来代
替,这就把减法问题转化成加法问题了(注:计算机的硬件结构中只有加法器,所以⼤部分的运算都必须最终转换为加法)。10和2对模12⽽⾔互为补数。同理,计算机的运算部件与寄存器都有⼀定字长的限制(假设字长为16),因此它的运算也是⼀种模运算。当计数器计满16位也就是65536个数后会产⽣溢出,⼜从头开始计数。产⽣溢出的量就是计数器的模,显然,16位⼆进制数,它的模数为2^16=65536。在计算中,两个互补的数称为“补码”。⽐如⼀个有符号8位的数可以表⽰256个数据,最⼤数是0 1 1 1 1 1 1 1(+127),最⼩数1 0 0 0 0 0 0 0 (-128);那么第255个数据,加2和减254都是⼀样的效果得出的结果是第⼀个数据 ,所以2和254是⼀样的效果。对于255来说2和254是互补的数。
求⼀个正数对应补码是⼀种数值的转换⽅法,要分⼆步完成:
第⼀步,每⼀个⼆进制位都取相反值,即取得反码;0变成1,1变成0。⽐如,00001000的反码就是11110111。
第⼆步,将上⼀步得到的反码加1。11110111就变成11111000。所以,00001000的⼆进制补码就是11111000。也就是说,-8在计算机(8位机)中就是⽤11111000表⽰。
不知道你怎么看,反正我觉得很奇怪,为什么要采⽤这么⿇烦的⽅式表⽰负数,更直觉的⽅式难道不好吗?
⼆进制补码的好处
⾸先,要明确⼀点。计算机内部⽤什么⽅式表⽰负数,其实是⽆所谓的。只要能够保持⼀⼀对应的关系,就可以⽤任意⽅式表⽰负数。所以,既然可以任意选择,那么理应选择⼀种⽤的爽直观⽅便的⽅式。
⼆进制的补码就是最⽅便的⽅式。它的便利体现在,所有的加法运算可以使⽤同⼀种电路完成。
还是以-8作为例⼦。假定有两种表⽰⽅法。⼀种是直觉表⽰法,即10001000;另⼀种是2的补码表⽰法,即11111000。请问哪⼀种表⽰法在加法运算中更⽅便?随便写⼀个计算式,16 + (-8) = ?16的⼆进制表⽰是 00010000,所以⽤直觉表⽰法,加法就要写成:
00010000
+10001000原码形式-8
---------
10011000
可以看到,如果按照正常的加法规则,就会得到10011000的结果,转成⼗进制就是-24。显然,这是错误的答案。也就是说,在这种情况下,正常的加法规则不适⽤于正数与负数的加法,因此必须制定两套
运算规则,⼀套⽤于正数加正数,还有⼀套⽤于正数加负数。从电路上说,就是必须为加法运算做两种电路。所以⽤原码表⽰负数是不⾏的。
现在,再来看⼆进制的补码表⽰法。
00010000
+11111000补码形式-8
---------
100001000
可以看到,按照正常的加法规则,得到的结果是100001000。注意,这是⼀个9位的⼆进制数。我们已经假定这是⼀台8位机,因此最⾼的第9位是⼀个溢出位,会被⾃动舍去。所以,结果就变成了00001000,转成⼗进制正好是8,也就是16 + (-8) 的正确答案。这说明了,2的补码表⽰法可以将加法运算规则,扩展到整个整数集,从⽽⽤⼀套电路就可以实现全部整数的加法。
⼆进制补码的本质,本质是⽤来表⽰负整数的
在回答⼆进制补码为什么能正确实现加法运算之前,我们先看看它的本质,也就是那两个求补码步骤的转换⽅法是怎么来的。下⾯描述了⼀个正数怎么求它对应负数在计算机的表达⽅式。⽐如128,正数为10000000,但是惊奇的发现-128也是10000000。但是这⾥由于属于数据类型的限定,第⼋位同样⼀个1代表不同的含义,前⾯的 1是数值位,后⾯数的 1是符号位。
要将正数转成对应的负数,其实只要⽤0减去这个数就可以了。⽐如,-8其实就是0-8。⽤模数的概念解释如下图
已知8的⼆进制是00001000,-8就可以⽤下⾯的式⼦求出:
00000000
-00001000
---------- - - -
因为00000000(被减数)⼩于0000100(减数),所以不够减。请回忆⼀下⼩学算术,如果被减数的某⼀位⼩于减数,我们怎么办?很简单,问上⼀位借1就可以了。
所以,0000000也问上⼀位借了1,也就是说,被减数其实是100000000,这是重点;算式也就改写成:
100000000
-00001000
---------- - -
11111000
进⼀步观察,可以发现可分拆为100000000 = 11111111 + 1,所以上⾯的式⼦可以拆成两个:
11111111
-00001000
---------
11110111取反
+00000001加⼀
---------
11111000
⼆进制的补码两个转换步骤就是这么来的。
举个例⼦,⽐如-128补码的由来,先把正整数128⼆进制表⽰出来10000000求-128的补码
1 1 1 1 1 1 1 1
-1 0 0 0 0 0 0 0
---------
0 1 1 1 1 1 1 1
+0 0 0 0 0 0 0 1
---------
1 0 0 0 0 0 0 0
即-128的补码是10000000。8位的结构能表⽰的最⼩数是-128;
所以可以总结求补码的范式是这样的:
求n位系统的⼀个数正数A : 01101101101……….11101100(n位⼆进制),怎么求他的补码呢,就⽤n位的1111111111111111111…..111(n位) - 11101101101……….11101100(n位⼆进制) + 1 = A的补码就⾏啦!但是
如果⼀个1111111111111…..111111(n位全为1的正整数的补码),要⽤1111111111111…….11111(n+1位) -1111111111111…..111111(n位全为1的正整数) +1 才能求的她对应的补码。
如uint16 A =200, uint16 B =65535,那么C =A-B;
65535的补码:正数65535为1111 1111 1111 1111,进⾏下⾯的计算求得B的补码即-B;先展⽰有补码符号位,即补码有最⾼位位1的;
1 1111 1111 1111 1111 -1111 1111 1111 1111 +1 =1 0000 0000 0000 0001,相当于被减数是10 0000 0000 0000 0000(18位) =1 1111 1111 1111 1111 +1
因为A和B 都是16位的⽆符号数,所以65535的补码最⾼位舍去,相当于被减数是1 0000 0000 0000 0000 =1111 1111 1111 1111 +1,即可以⽤上⾯的范式⽅法,但是这样-B就没有体现它的负数的符号位了;当然这是因为16位运算超出16位的位都舍去了。即-B=1;即A-B= 200+1 =201。其实也可以⽤模数概念解释A -B;如下图正数的模数
为什么正数加法也适⽤于⼆进制的补码?
实际上,我们要证明的是,X-Y或X+(-Y)可以⽤X加上Y的2的补码(-Y)完成。
Y的⼆进制补码等于(11111111-Y)+1。所以,X加上Y的2的补码,就等于:X + (11111111-Y) + 1;我们假定这个算式的结果等于Z,即 Z = X + (11111111-Y) + 1。
接下来,分成两种情况讨论。
第⼀种情况,如果X⼩于Y,那么Z是⼀个负数。这时,我们就对Z采⽤补码的逆运算,就是在做⼀次求补码运算,求出它对应的正数绝对值,只要前⾯加上负号就⾏了。所以,
Z = -[11111111-Z+1] = -[11111111-(X + (11111111-Y) + 1)+1)] = X - Y;这⾥如果X Y Z都是⽆符号型的,且X < Y 那么Z 最终得到的数是|X-Y|距离的绝对值了,⽐如X=1,Y= 255,那么Z=2,因为从255到1只要加两次就到了。这⾥你不要问我为什么,这⾥就⽤到上⾯的模概念。
第⼆种情况,如果X⼤于Y,这意味着Z肯定⼤于11111111,但是我们规定了这是8位机,最⾼的第9位是溢出位,必须被舍去,舍去相当于减去吗!所以减去100000000。所以,
Z = Z - 100000000 = X + (11111111-Y) + 1 - 100000000 = X - Y
这就证明了,在正常的加法规则下,可以利⽤2的补码得到正数与负数相加的正确结果。换⾔之,计算机只要部署加法电路和补码电路,就可以完成所有整数的加法。