admin管理员组

文章数量:1594248

2024年3月31日发(作者:)

1、汉字编码系统

主要是解决在汉字处理过程中的各个环节中汉字的编码问题。汉字编码常指汉字的国

家标准信息码、汉字机内码、输入编码和字型编码。

(1)汉字交换码

①概念:汉字交换码是计算机与其他系统或设备间交换汉字信息的标准编码。

②1981年5月,《信息交换用汉字编码字符集·基本集》(代号GB2312-80),该字符

集共收录了6763个汉字和682个图形符号。6763个汉字按其使用频率和用途,又可分

为一级常用汉字3755个,二级次常用汉字3008个。其中一级汉字按拼音字母顺序排列,

二级汉字按偏旁部首排列。

采用两个字节对每个汉字进行编码,每个字节各取七位,这样可对128×128=16384

个字符进行编码。

③区位码: 国家标准码先把汉字排列在一个94行×94行的方阵(二维表格)中,在

此正方形矩阵中,每一行称为“区”,每一列称为“位”,这样组成了一个共有94区,每

个区有94位的字符集。由这个字符集矩阵表,引出了表示汉字的两种编码,一种称这区

位码,另一种被称为国标码。这两种编码都是由两个字节组成,高字节表示“区”的代码,

低字节表示“位”的代码。

区位码是用十进制数表示一个汉字或图形符号在字符集中的位置。二维表中,每一行

称为一个区,用汉字编码的第一个字节表示,称为区码。每个汉字在一行中的位置用第二

个字节表示,称为位码。

国标码通常用十六进制表示。

(2)汉字输入码

概念:也称外码,是为了将汉字输入计算机而编制的代码,它是代表某一汉字的一级

键盘符号。

种类:

流水码:根据汉字的排列顺序形成汉字编码,如区位码、国标码、电报码等。

音码:根据汉字的“音”形成汉字编码,如全拼码、双拼码、简拼码等。

形码:根据汉字的“形”形成汉字编码,如王码五笔、郑码、大众码等。

音形码:根据汉字的“音”和“形”形成汉字编码,如表形码、钱码、智能ABC等。

不论是哪一种汉字输入方法,利用输入码将汉字输入计算机后,必须将其转换为汉字

机内码才能进行相应的存储和处理。

(3)汉字机内码

概念:汉字机内码(内码)是计算机系统中用来存储和处理中、西方信息的代码。西

本文标签: 汉字编码编码表示字节字符集