yanwushu的博客

原文地址:

1.ANSI指American National Standards Institute(美国国家标准学会)。

2.ANSI编码不是一种具体的编码方式,而是一种指定在某些环境下使用某些编码方式的标准。比如,在中文环境中ANSI的编码标准为GBK,在日语环境中ANSI的编码标准则是Shift_JIS编码。

3.ASCII编码使用0x00~0x7F之间的每个字节表示一个字符,英语世界之外的其他国家对此字符集进行了扩展,他们使用0x00~0x80之间的1个到4个字节来表示一个字符,形成了自己语言的字符集,比如GBK, Big5、Shift_JIS等。

4.需要注意的是ANSI是ASCII的扩展,这也就意味着0x00~0x7F之间的字符也是asni的一部分,并且他们是一个字节表示一个字符。或者说,在使用ANSI编码的文件中,,当遇到ASCII标准的字符时,使用一个字节表示一个字符,否则,将使用1到4个字节来表示一个字符,当然,在中文环境下,也就是GBK编码中,非ASCII字符是用两个字节来表示。

5.ASNI编码是不利于跨语言数据交流的,比如windows文件默认使用ANSI编码。那么,在中文windows下创建的文件,在日文windows下是无法正确解析的,因为日文windows下ANSI编码使用的是Shift_JIS编码。

6.为了统一世界各种语言的编码,unicode编码被创造出来,unicode使用两个字节来表示一个字符。

7.在某个角度理解,ANSI编码是一种历史遗留,应该被淘汰,进而使用更加先进、方便的unicode编码。

谁是谁生命的点缀。

yanwushu的博客

相关文章:

你感兴趣的文章:

标签云: