unicode码查询,unicode编码是什么?
unicode码查询,unicode编码是什么?详细介绍
本文目录一览: 怎样查一个字符的unicode编码?
word中输入你要查询的汉字或其他字符,随即按下Alt+X即可。
现在有很多工具可以辅助查询。
可以通过这个工具:http://tool.oschina.net/encode
或者推荐这个网址: http://bianma.supfree.net/ Unicode
另外UNICODE官网上也提供了对照表的下载,只不过那个东西是PDF,可以搜索字的对应unicode
怎样用win7系统自带的字符映射表查找我想要的汉字对应的Unicode码
http://www.guabu.com/zhuanma/你可以试试这个网址,有你想要的转换器.或者你下载一个汉字转unicode工具.
把下面的“高级查看”打上 勾,在“分组依据”里选“按拼音分类的简体中文”,就可以找到“好”了。你试试
依次单击开始——所有程序——附件——命令提示符,打开命令提示符,输入chcp,按回车键执行,会查询当前系统的活动代码页,它指明了当前系统使用的编码,如下图所示:
936 代表GBK 扩展的EUC-CN 编码( GB 2312-80编码,包含 6763 个汉字)到Unicode (GB13000.1-93)中定义的20902个汉字,即中国大陆使用的是简体中文zh_CN.。其它常见的还有:
932 :Shift-JIS包含日本语 charset JIS X 0201 (每个字符一个字节) 和 JIS X 0208 (每个字符两个字节),所以 JIS X 0201平假名包含一个字节半宽的字符,其剩馀的60个字节被用做7076个汉字以及648个其他全宽字符的首字节.同EUC-JP编码区别的是, Shift-JIS没有包含JIS X 202中定义的5802个汉字.
949 :UnifiedHangul (UHC) 是韩文 EUC-KR 编码(KS C 5601-1992 编码,包括2350 韩文音节和 4888 个汉字a)的超集,包含 8822个附加的韩文音节( 在C1中 )
950:是代替EUC-TW (CNS 11643-1992)的 Big5 编码(13072 繁体 zh_TW 中文字) 繁体中文,这些定义都在Ken Lunde的 CJK.INF中或者 Unicode 编码表中找到.
常用Unicode编码
unicode编码范围: 汉字:[0x4e00,0x9fa5](或十进制[19968,40869]) 数字:[0x30,0x39](或十进制[48, 57]) 小写字母:[0x61,0x7a](或十进制[97, 122]) 大写字母:[0x41,0x5a](或十进制[65, 90])
汉字编码范围:\u4E00-\u9FA5 双字节字符编码范围:\u0391-\uFFE5
双字节字符编码范围
汉字unicode编码表
一般使用2w基本汉字就够了
| 字符集 | 字数 | Unicode 编码 | | 基本汉字 | 20902字 | 4E00-9FA5 | | 基本汉字补充 | 38字 | 9FA6-9FCB | | 扩展A | 6582字 | 3400-4DB5 | | 扩展B | 42711字 | 20000-2A6D6 | | 扩展C | 4149字 | 2A700-2B734 | | 扩展D | 222字 | 2B740-2B81D | | 康熙部首 | 214字 | 2F00-2FD5 | | 部首扩展 | 115字 | 2E80-2EF3 | | 兼容汉字 | 477字 | F900-FAD9 | | 兼容扩展 | 542字 | 2F800-2FA1D | | PUA(GBK)部件 | 81字 | E815-E86F | | 部件扩展 | 452字 | E400-E5E8 | | PUA增补 | 207字 | E600-E6CF | | 汉字笔画 | 36字 | 31C0-31E3 | | 汉字结构 | 12字 | 2FF0-2FFB | | 汉语注音 | 22字 | 3105-3120 | | 注音扩展 | 22字 | 31A0-31BA | | 〇 | 1字 | 3007 |
请教,如何查询特殊字符的Unicode编码
new String(strLine.getBytes("iso8859-1"),"gb2312")
其实这里很好明白
首先将字符串转换成byte数组。。以iso8859-1的编码来转换。。
然后使用new String创建一个新字符串,前面带上byte[]数组 后面带上他的具体编码。。
一般转码都使用这样的方式。。JSP里经常出现乱码的
都是加上过滤器然后中间使用这个new String(strLine.getBytes("iso8859-1"),"gb2312")方式将编码转换。
Unicode字符列表的Unicode 编码表
复制到EXCEL然后自动填充
=(ROW()-1)*20+COLUMN()&" "&UNICHAR((ROW()-1)*20+COLUMN())
Unicode 编码表 BMP SMP SIP SSP 0000—0FFF 8000—8FFF 10000—10FFF 20000—20FFF 28000—28FFF E0000—E0FFF 1000—1FFF 9000—9FFF 21000—21FFF 29000—29FFF 2000—2FFF A000—AFFF 12000—12FFF 22000—22FFF 2A000—2AFFF 3000—3FFF B000—BFFF 23000—23FFF 4000—4FFF C000—CFFF 24000—24FFF 2F000—2FFFF 5000—5FFF D000—DFFF 1D000—1DFFF 25000—25FFF 6000—6FFF E000—EFFF 26000—26FFF 7000—7FFF F000—FFFF 1F000—1FFFF 27000—27FFF注:除非有特别指明,否则以下符号皆属“半角”而非“全角”。
汉字区位码查询
“晞”属古字、生僻字,在标准区位码表中没有。
GBK码:38276
UNICODE编码:26206
区位码:-1128
晞的输入法技巧:
如果五笔或者其它输入法打不出某个字,可以用这个方法打出来,按住 Alt 键不放,接着在小键盘上输入该字的 GBK 码,然后松开 Alt 键,就打出来了。如果 GBK 码不对,就输入 UNICODE 编码。这两种编码在下面都可以看到。 比如打“晞”字,可以先按住 Alt 键然后用小键盘输入38276,再松手就可以了。如果你打出来的不是“晞”,就换 26206 这个数字再试。上述方法,一定要是在小键盘上,也就是数字键盘,输入之前记得先打开 (Num Lock) 哦。
如何查询汉字的机内码?
我目前在网上可以查询汉字的机内码。
汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。 汉字内码查看器是一款简单易用的汉字内码查询工具。该软件只需要输入一个汉字就可以查看它所对应的十进制和十六进制的区位码(GBC)、Unicode码和GBK内码。
unicode编码是什么?
Unicode是一种字符编码方案,它为每种语言中的每个字符都设定了统一唯一的二进制编码,以实现跨语言、跨平台进行文本转换、处理的要求。
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。目前的Unicode字符分为17组编排,0x0000至0x10FFFF,每组称为平面(Plane),而每平面拥有65536个码位,共1114112个。
Unicode 编码表
BMP SMP SIP SSP
0000—0FFF 8000—8FFF 10000—10FFF 20000—20FFF 28000—28FFF E0000—E0FFF
1000—1FFF 9000—9FFF 21000—21FFF 29000—29FFF
2000—2FFF A000—AFFF 12000—12FFF 22000—22FFF 2A000—2AFFF
3000—3FFF B000—BFFF 23000—23FFF
4000—4FFF C000—CFFF 24000—24FFF 2F000—2FFFF
5000—5FFF D000—DFFF 1D000—1DFFF 25000—25FFF
6000—6FFF E000—EFFF 26000—26FFF
7000—7FFF F000—FFFF 1F000—1FFFF 27000—27FFF
mysql查询未解码的unicode汉字,模糊查询不成功怎么办?
mysql查询的时候会将\干掉,\x0d\x0a你可以用mysql的like通配符来做\x0d\x0alike '%\u5f20\u4e09%'\x0d\x0a变成\x0d\x0alike '%_u5f20_u4e09%'