梳理下中文编码的历史

编程入门 行业动态 更新时间:2024-10-11 17:26:48

梳理下<a href=https://www.elefans.com/category/jswz/34/1769975.html style=中文编码的历史"/>

梳理下中文编码的历史

最早,计算机使用7位编码来表示英语字符,而其他使用拉丁字母、希腊字母、西里尔字母、希伯来字母等的语文,由于只使用数十个字母,传统上均使用8位编码的ISO/IEC 8859标准来表示。

但由于汉语、日语及朝鲜语字数众多,无法用单一个8位字符来表达,故需要多于一个字节来代表一个字。于是,ISO 2022就设计出来让汉语、日语及朝鲜语可以使用数个7位编码的字符来示(当时通信领域的协议采用了第8位做校验纠错用途)。

 

GB 2312-80 即 GB2312, 遵循 ISO 2022 由中国国家标准总局发布,1981年5月1日实施,收录6763个汉字。

 

EUC(Extended Unix Code)使用8位编码来表示字符的方法,于1991年标准化,这是针对 Unix 系统,由一些 Unix 公司所开发,遵循于 ISO 2022,而 EUC-CN 就是 GB2312 的编码实现,可以说通过 EUC 把 GB2312 给标准化了。

 

早期的 window 遵循 EUC 编码规范,将 EUC-CN 规定为 CP936(Code Page),这时可以认为 EUC-CN = CP936 = GB2312

 

1993年,Unicode 1.1 版本推出,收录中国大陆、台湾、日本及韩国通用字符集的汉字,总共有20,902个。

同年,我国制定等同于 Unicode 1.1 的 GB 13000.1-93,这仅是标准

 

在我国颁布 GB 13000.1-93 后,微软正在做 window95,鉴于我国制作了 GB 13000.1-93 的标准,于是将 CP936 中未使用的

更多推荐

梳理下中文编码的历史

本文发布于:2024-03-05 13:43:50,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1712446.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:中文   历史

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!