1.2 数据在计算机中的表示
考点6 计算机采用二进制编码
1.二进制编码
在计算机中,数字和符号都是用电子元件的不同状态表示的,即以电信号表示。电信号只有两种,即“0”和“1”。所以计算机内部的信息都是以这两个状态的组合存储的,即二进制数。平常在解决实际问题中输入/输出使用的都是十进制数,即“逢十进一”。而计算机内部采用二进制数,按“逢二进一”的原则进行计数,即每位计满2时向高位进1。
二进制数的特点是:数字的个数等于基数2;最大数字是1,最小数字是0;有两个数字字符——0、1;在数的表示中,每个数字都要乘以基数2的幂次方,例如:(101.01)2=1×22+0×21+1×20+0×2 -1+1×2 -2。
计算机内部均使用二进制数来表示各种信息,但计算机与外部交往仍采用人们熟悉和便于阅读的形式,如十进制数据、文字显示以及图形描述等。而两种数制的转换是由计算机系统的硬件和软件来实现的。计算机系统采用二进制编码的主要原因是电路设计简单、运算简单、工作可靠、逻辑性强。
2.十进制数及其之间的转换
(1)十进制整数转换成二进制整数。把十进制整数转换成二进制整数是采用“除二取余”法。具体步骤是:把十进制整数除以2得一商数和一余数;再将所得的商除以2,又得到一个新的商数和余数;这样不断地用2去除所得的商数,直到商等于0为止。每次相除所得的余数便是对应的二进制整数的各位数码。第一次得到的余数为最低有效位,最后一次得到的余数为最高有效位。
上述方法同样适用于十进制数对十六进制数的转换,只是使用的基数不同。
(2)二进制数与十六进制数间的转换。二进制数转换成十六进制数的方法是从个位数开始向左按每4位一组划分,不足4位的组以0补足,然后将每组4位二进制数代之以一位十六进制数字即可。十六进制数转换成二进制数的方法相反。
表1.2列出了0~15这16个十进制数与二进制数、十六进制数的对应表示。
表1.2 常用计数制表示
(3)非十进制数转换成十进制数。利用按权展开的方法,可以把任意数制转换成十进制数。
常见问题
计算机内部使用什么编码表示?
计算机内部使用二进制编码表示数据、指令和地址信息。
真题精选
【例题1】计算机中所有信息的存储都采用______。
A.十进制
B.十六进制
C.ASCII
D.二进制
【答案】D
【解析】计算机内部均使用二进制数来表示各种信息。考生要了解数据在计算机中的表示方法,并掌握二进制的优点。
【例题2】与二进制数1 010.01等值的十进制数是______。
A.16
B.10.25
C.10.52
D.11.5
【答案】B
【解析】按“逢二进一”的原则把二进制数展开成:
(1 010.01)2=1×23+0×22+1×21+0×20+0×2 -1+1×2 -2=8+0+2+0+0+0.25=10.25。
【例题3】二进制数1 101 10对应的十进制数是______。
A.53
B.54
C.55
D.56
【答案】B
【解析】考生要熟记二进制整数转换成十进制整数的算法。二进制数转换成十进制数的方法是按权展开,数值为0的位忽略不计。此二进数按权展开为:110 110=1×25+1×24+1×22+1×21=54。
【例题4】与十进制数5 324等值的十六进制数为______。
A.1 144
B.14C4
C.14CC
D.1 C4C
【答案】C
【解析】十进制整数转换成十六进制整数的方法是“除十六取余”法,即将十进制数除以16得一商数和一余数,再将商除以16,这样不断地用所得的商去除以16,直到商为0为止。每次所得的余数即对应的十六进制整数的各位数字(从低到高)。按照此方法,十进制数5 324转换成十六进制数为14CC。
考点7 计算机中的信息单元
真考链接
该考点的考核概率为80%,以选择题的形式出现,分值为0~1分。
1.位(bit)
位是度量数据的最小单位,在数字电路和电脑技术中采用二进制,代码只有0和1,无论0还是1在CPU中都是1位。
2.字节(Byte)
一个字节由八位二进制数组成(1Byte=8bit)。字节是信息组织和存储的基本单元,也是计算机体系结构的基本单元。
早期的计算机并无字节的概念,20世纪50年代中期,随着计算机逐渐从单纯用于科学计算扩展到数据处理领域,为了在体系结构上兼顾表示“数”和“字符”,就出现了“字节”。
为了便于衡量存储器的大小,统一以字节(Byte,简写B)为单位。常用的存储单元大小表示为:
KB 1 KB=1 024 B
MB 1 MB=1 024 KB
GB 1 GB=1 024 MB
TB 1 TB=1 024 GB
真题精选
【例题1】计算机中信息存储的基本单元是______。
A.十进制数
B.字节
C.二进制数
D.字
【答案】B
【解析】考生要了解在计算机中数据存储的基本单元。计算机中存储单元是以字节(Byte)为单位计算,字节也是计算机体系结构的基本单元。
【例题2】1 TB是______MB。
A.1 024
B.1 024×1 024
C.1 024×1 024×1 024
D.0
【答案】B
【解析】考生要掌握常用存储单元之间大小的转换。1 TB是1 024 GB,而1 GB又是1 024 MB,所以1 TB=1 024 GB=1 024×1 024 MB。
考点8 字符
真题链接
考点8的考核概率为100%,以选择题的形式出现,分值为1 ~3分。
1.西文字符的编码
计算机中常用的字符编码有EBCDIC码和ASCII码。ASCII码有7位码和8位码两种版本。国际的7位ASCII码是用7位二进制数表示一个字符的编码,其编码范围从0000000B ~1111111B,共有27=128个不同的编码值,即可以表示128个不同的编码。
数字“0~9”的起始ASCII码值为“048”;大写英文字母“A~Z”的起始ASCII码值为“65”,小写英文字母的ASCII码值比对应的大写字母的多32,即在大写字母ASCII码值的基础上加32即为对应的小写字母的ASCII码值。另外,比较ASCII码值大小的试题也较为常见。在ASCII码表中,基本是按数字、大写英文字母、小写英文字母的顺序排列的,排在后面的码值比排在前面的大。
小提示
ASCII码值大小的比较是考试的常见题型,所以记忆ASCII码是非常重要的,但有128个编码,不好记忆。推荐一个小技巧:重点记忆“A”“Z”和“a”“z”对应编码的规律,其他的英文字母可以根据以上规律进行推算。
2.中文字符
GB2312又称为GB 2312—1980字符集,全称为《信息交换用汉字编码字符集 基本集》,由原中国国家标准总局发布,1981年5月1日开始实施。
汉字信息交换码简称交换码,也叫国标码。国标码的编码范围是2121H~7E7EH。区位码和国标码之间的转换方法是将一个汉字的十进制区号和十进制位号分别转换成十六进制数,然后分别加上20H,就成为此汉字的国标码,即:
汉字国标码=区号(十六进制数)+20H位号(十六进制数)+20H
在得到汉字的国标码之后,就可以使用以下公式计算汉字的机内码:
汉字机内码=汉字国标码+8080H
汉字字形码也叫字模或汉字输出码。在计算机中,由于8个二进制位组成一个字节(字节是度量空间的基本单位),可见一个16×16点阵的字型码需要16×16/8=32字节存储空间。
3.汉字的处理过程
从汉字编码的角度看,计算机对汉字信息的处理过程实际上就是各种汉字编码间的转换过程。这些编码主要包括汉字输入码、汉字内码、汉字地址码、汉字字形码等。汉字信息处理的流程如图1.2所示。
图1.2
4.其他汉字内码
(1)BIG5字符集:又称大五码或五大码。
(2)GB18030字符集:GB18030的全称是GB 18030—2000《信息交换用汉字编码字符集基本集的扩充》,是我国政府于2000年3月17日发布的新的汉字编码国家标准,2001年8月31日后在中国市场上发布的软件必须符合该标准。
(3)Unicode字符集:是Universal Multiple-Octet Coded Character Set 通用多八位编码字符集的简称。
常见问题
区位码和国标码之间如何转换?
将一个汉字的十进制区号和十进制位号分别转换成十六进制数,然后分别加上20H,就成为此汉字的国标码。
真题精选
【例题1】在下列字符中,其ASCII码值最大的一个是______。
A.8
B.9
C.a
D.b
【答案】D
【解析】ASCII码由4组符号组成:第1组是控制字符,第2组是字符和数字,第3组是大写字母,第4组是小写字母。每一个符号对应一个数值,越往后的符号对应的数值就越大。
【例题2】设汉字点阵为32×32,那么100个汉字的字形码信息所占用的字节数是______。
A.12 800
B.128
C.32×3 200
D.32×32
【答案】A
【解析】考生要了解汉字字形码的存储特点。描述汉字字形的方法主要有点阵字和轮廓字两种。汉字字形码也叫字模或汉字输出码。在计算机中,8个二进制位组成一个字节,可见一个32×32点阵的字形码需要32×32/8=128字节存储空间,则100个汉字的字形码信息所占用的字节数为12 800。