汉字与字符的编码--688IT编程网

unicode系列全部汉字

对于英文来说，ascii码0-127就足以代码所有字符，对于中文而言，则必须使用两个字节(byte)来代表一个字符，具第一个字节必须大于127(所以我们有许程序判断中文都是以ascii码大于127作为条件) 以上用两个字节来表示一个中文的方式，在习惯上称为双字节(即DBCS:Double-ByteCharacterSet)，而相对之下，英文的字符码就称为单字节SBCS(Single-ByteCharacterSet)。虽然双字节(DBCS)足以解决中英文字符混合使用情况，但对于不同字符系统而言，必须经过字符码转换，非常麻烦。例如：中英文混合情况，日文，韩文等等。为解决这个问题，Apple,Xerox,Microsoft,IBM,很多公司联合起来制订了一套可以适用于全世界所有国家的字符码，就称为Unicode Unicode的特点是：不管哪一国的字符码均以两个Byte表示，例如"A"在Unicode则是16进制41和00的组合，即4100，高位41(转换为Ascii码即是65=A)， WindowsNT/2000以Unicode来表示字符集，例如你可以看到MSSQLServer中产生的SQL文件可以选择是以Unicode来保存还是以普通格式来保存，如果你以Unicode保存，则在95/98平台许多软件均无法正确读出其格式。同时你还可以注意到95/98中API定义，许多名称结尾是有一个A的，例如 WriteProfileStringA 而在NT/2000操作系统中，提供了两套API，另外一个命令是WriteProfileStringW，以W结尾的API只适用于NT/2000。（在NT中使用以W结尾的API函数效率比A结尾的要快，因为省去了Unicode和DBCS/SBCS的转换过程）这样我们经常要用到的判断字符串长度的函数，在NT和95/98下执行结果不同，如下：(下面代码适合于VB,ASP) 95/98中： len("abc中国")返回7(因为每个中文作为两个Ascii码来看) nt/2000中： len("abc中国")返回5(因为每个字符都作为一个Unicode来看) 明天将介绍如何在VB/NT环境下使len("abc中国")返回长度等于7 (PB不存在以上情况，除非你在NT下使用PB的Unicode版本，通常我们大家使用的均是PB的Windows32位版本)

发表评论

688IT编程网

汉字与字符的编码

发表评论

推荐文章

潜水的新意思是什么意思简短20字

浙江省专升本英语作文基准分是什么意思

民法典的农村承包经营户的定义是什么

出资与股份的区别是什么都有哪些意思

农村土地流转的意思是是什么

热门文章

不可救药的意思是什么

定夺的意思是什么意思

Evolution of inflammation in nonalcoholic

心肌组织ros免疫荧光结果

一种活性氧制备方法

新版dpph自由基清除实验-实验流程图-操作图解-李熙灿-Xican Li_百度文...

光损伤视网膜细胞的机制研究

大黄素通过调控ROS和NLRP3炎症体通路改善草酸钙结晶诱导的肾小管上皮...

dcfh作用原理

反应活性氧与前列腺癌的研究进展

Nrf2相关知识普及

活性氧及其在氧化应激中的作用

反应活性氧的概念

血管内皮功能障碍与衰老

活性氧简介及其产生

Sodium transport in plants- a critical review_图文

Oxidative Stress in Neurodegeneration

生物超微弱发光与生物体内活性氧含量的相关性及应用

纳米氧化铈抗氧化保护心肌细胞的研究进展

微塑料影响sod的英文文献

最新文章

潜水的新意思是什么意思简短20字

鲲鹏展翅的意思是什么_鲲鹏展翅的寓意是什么

渑池怎么读_渑的拼音_渑的意思是什么

姝怎么读_姝的拼音_姝的意思是什么

天长地久是什么意思600字作文

作文审题是什么意思举个例子

标签列表