梳理下中文编码的历史

编程入门行业动态更新时间:2024-10-11 17:26:48

梳理下<a href=https://www.elefans.com/category/jswz/34/1769975.html style= 中文编码的历史"/>

最早，计算机使用7位编码来表示英语字符，而其他使用拉丁字母、希腊字母、西里尔字母、希伯来字母等的语文，由于只使用数十个字母，传统上均使用8位编码的ISO/IEC 8859标准来表示。

但由于汉语、日语及朝鲜语字数众多，无法用单一个8位字符来表达，故需要多于一个字节来代表一个字。于是，ISO 2022就设计出来让汉语、日语及朝鲜语可以使用数个7位编码的字符来示(当时通信领域的协议采用了第8位做校验纠错用途)。

GB 2312-80 即 GB2312, 遵循 ISO 2022 由中国国家标准总局发布，1981年5月1日实施，收录6763个汉字。

EUC（Extended Unix Code）使用8位编码来表示字符的方法，于1991年标准化，这是针对 Unix 系统，由一些 Unix 公司所开发，遵循于 ISO 2022，而 EUC-CN 就是 GB2312 的编码实现，可以说通过 EUC 把 GB2312 给标准化了。

早期的 window 遵循 EUC 编码规范，将 EUC-CN 规定为 CP936（Code Page），这时可以认为 EUC-CN = CP936 = GB2312

1993年，Unicode 1.1 版本推出，收录中国大陆、台湾、日本及韩国通用字符集的汉字，总共有20,902个。

同年，我国制定等同于 Unicode 1.1 的 GB 13000.1-93，这仅是标准

在我国颁布 GB 13000.1-93 后，微软正在做 window95，鉴于我国制作了 GB 13000.1-93 的标准，于是将 CP936 中未使用的

更多推荐

梳理下中文编码的历史

本文发布于:2024-03-05 13:43:50，感谢您对本站的认可！

中文历史

评论列表（有 0 条评论）