内码(MBCS)和nuicode码

计算机发明后,为了在计算机中表示字符,人们制定了一种编码,叫做ASCII码,ASCII码由一个字节中的7位(bit)表示,范围是0x00-0x7F共128个字符。用这128个数字  表示abcd…ABCD…1234….这些字符。后来又扩展了ASCII码的定义,使用一个字节的全部8位(bit)来表示字符了。这就叫扩展 ASCII码。范围是0x00-0xFF共256个  字符。
后来,中国人利用连续2个扩展ASCII码的扩展区域(0xA0以后)来表示一个汉字,该方法的标准叫GB-2312。后来,日文、韩文、阿拉伯文、台湾繁体都使用类似的方法扩展  了本地字符集的定义,现在统一称为MBCS字符集(多字节字符集)。这种方法是有缺陷的,因为各个国家的定义的字符集有交集,因此使用GB2312的软件,就不能在  BIG-5的环境下运行(显示乱码)。
为了把全世界的所有的文字符号都统一进行编码,于是制定了UNICODE标准字符集。UNICODE使用2个字节表示一个字符。这下终于好啦,全世界任何一个地区的软件,可以  不用修改就能在另一个地区运行了。UNICODE的范围是0x0000-0xFFFF共6万多个字符。

计算机发明后,为了在计算机中表示字符,人们制定了一种编码,叫做ASCII码,ASCII码由一个字节中的7位(bit)表示,范围是0x00-0x7F共128个字符。用这128个数字  表示abcd…ABCD…1234….这些字符。后来又扩展了ASCII码的定义,使用一个字节的全部8位(bit)来表示字符了。这就叫扩展 ASCII码。范围是0x00-0xFF共256个  字符。
后来,中国人利用连续2个扩展ASCII码的扩展区域(0xA0以后)来表示一个汉字,该方法的标准叫GB-2312。后来,日文、韩文、阿拉伯文、台湾繁体都使用类似的方法扩展  了本地字符集的定义,现在统一称为MBCS字符集(多字节字符集)。这种方法是有缺陷的,因为各个国家的定义的字符集有交集,因此使用GB2312的软件,就不能在  BIG-5的环境下运行(显示乱码)。
为了把全世界的所有的文字符号都统一进行编码,于是制定了UNICODE标准字符集。UNICODE使用2个字节表示一个字符。这下终于好啦,全世界任何一个地区的软件,可以  不用修改就能在另一个地区运行了。UNICODE的范围是0x0000-0xFFFF共6万多个字符。

分享到: 更多
版权申明:

本站保留所有原创文章的版权,本站地址:奔跑的博客[http://www.elecbench.com]

原创文章转载时请注明出处,并添加文章所在页面的链接:http://www.elecbench.com/%e5%86%85%e7%a0%81%e5%92%8cnuicode%e7%a0%81/

本站所有 2010年3月4日 以后发表、未标明为“转载”的文章均是本站原创。

发表评论


(设置自己的个性头像)

*

申请属于你的免费顶级域名