计算机世界里只有0和1,进位时逢二进一,借位时借一当二,称之为二进制。其物理表现形式可能是三极管的通电与断电、也可能是CPU的低电平与高电平。一个数在计算机中的二进制表示形式称之为机器数,机器数是带符号的,最高位表示符号,0为正数,1为负数。通过二进制转换为十进制的数为真值。
机器数与真值举例如下 :
- 2(真值)= 00000010(机器数)
- -2(真值)=10000010(机器数)
下面以8位二进制讲解原码、反码、补码的含义与原理。
原码
原码(true form)是一种计算机中对数字的二进制定点表示方法。原码表示法在数值前面增加了一位符号位(即最高位为符号位):正数该位为0,负数该位为1(0有两种表示:+0和-0),其余位表示数值的大小。
例如:2的原码为00000010,-2的原码为10000010
反码
反码通常是用来由原码求补码或者由补码求原码的过渡码。反码的表示方法为:
- 正数的反码为其自身,如2的原码和反码为00000010
- 负数的反码,符号位不变,其它位取反,如-2的反码为,11111101
补码
补码的表示方法是:
正数的补码就是其本身
负数的补码是在其原码的基础上, 符号位不变, 其余各位取反, 最后+1. (即在反码的基础上+1)
补码是为了计算机能用加法代替减法,简化运算器的设计而出现的。它还可以解决符号表示问题。在解释什么是补码前,我们先看只有原码和反码在计算机的实际应用中会遇到什么问题。
首先看原码,原码由于最高位定义的是符号位,因此对于8位有符号数来说,计算就会出现问题,因为避免运算器设计过于复杂,运算器并不能识别所谓的符号位,因此运算时符号位也会参与运算,并且运算器只有加法没有减法。举个简单的例子,1-1,结果应该是0,但用二进制原码进行运算
1 - 1 = 1 + (-1) = [00000001]原 + [10000001]原 = [10000010]原 = -2
结果并不是0,因此原码并不能满足需求。
再看使用反码计算上述结果:
1 - 1 = 1 + (-1)
= [0000 0001]原 + [1000 0001]原
= [0000 0001]反 + [1111 1110]反 = [1111 1111]反 = [1000 0000]原 = -0
注意上面反码的运算,我们可以看出两个相反数相减后,结果是8位二进制所能表示的最大值!便于理解,先忽略符号位,上述转十进制后就是
1+254=255
而8位二进制所有表示的最大无符号数正是255,然后8位二进制数共能表示2^8共256个符号,如果此时上面的结果再加一,会出现溢出,从而回到0位置的现象
[1111 1111]反 +[0000 0001]=[0000 0000]
这个就是我们要的1-1的结果0。补码等于反码加一的原理也在此。这就是模或取余的一种应用,在有限的计数范围,减去一个数也可以用加上一个数来表示。很明显,二进制表示的数值范围是[00000000, 11111111],它的模是256,而反码的计算结果表明反码的模只是255,因此需要加一才能使8位二进制刚好溢出,丢弃一个模,从而回到原点,得到正确的结果0。
模的概念
“模”是指一个计量系统的计数范围,如过去计量粮食用的斗、时钟等。计算机也可以看成一个计量机器,因为计算机的字长是定长的,即存储和处理的位数是有限的,因此它也有一个计量范围,即都存在一个“模”。如:时钟的计量范围是0~11,模=12。表示n位的计算机计量范围是0到(2^n)-1,模=2^n,“模”实质上是计量器产生“溢出”的量,它的值在计量器上表示不出来,计量器上只能表示出模的余数。任何有模的计量器,均可化减法为加法运算。
假设当前时针指向8点,而准确时间是6点,调整时间可有以下两种拨法:一种是倒拨2小时,即8-2=6;另一种是顺拨10小时,8+10=12+6=6,即8-2=8+10=8+12-2(mod 12).在12为模的系统里,加10和减2效果是一样的,因此凡是减2运算,都可以用加10来代替。同理,在8位二进制计算机中,它的模是2^8=256,把它当成模为256的时钟,当前是8点,准确时间是6点,做法可以是倒拨2小时(8-2),也可以是顺拨254小时,8+254=256+6,然后我们看8+254用二进制的表现形式是
8-2=8+254=[0000 1000]+[1111 1110]=[0000 0110]=6
可见上面的[1111 1110]正是-2的补码,我们也可以从原码出发推出这个补码:
-2=[1000 0010]原=[1111 1101]反=[1111 1110]补
看到这里估计明白了,所谓补码,其实就是关于模256的一个互补数。通过取模,计量范围的溢出来实现减法用加法实现。互补数的特点是它们相加正好等于模,比如2和254是互补数,它们相加正好是模数256。当计算减法时,两个互补数相加后正好一个模,溢出回到原点0,剩下的数自然就是减后的数值。我想,之所以叫补码也是这个原因的吧。想不明白的话把它当成一个有着256个时刻的时钟,通过往前拨(加法)和往后拨(减法)的方法去理解。
2+254=[0000 0010]+[1111 1110]=[0000 0000]
可见刚好溢出。