汉字与unicode编码转换,unicode编码怎么转换成中文显示

汉字与unicode编码转换,unicode编码怎么转换成中文显示详细介绍

本文目录一览： python 字符串格式的unicode编码转中文

?python对于Unicode编码可以使用decode进行转换成中文：

>>> str = b'\xe8\xb4\xb9\xe8\x84\x91\xe5\xad\x90'

>>> str.decode('utf-8')

'费脑子'

如果是字符串类型的Unicode编码没办法直接用decode进行转换：

>>>?str ="\\xe8\\xb4\\xb9\\xe8\\x84\\x91\\xe5\\xad\\x90"

>>>?str.decode('utf-8')

Traceback (most recent call last):

? File "

", line 1, in

AttributeError: 'str' object has no attribute 'decode'

处理方式：

>>>?str = eval("b" + "\"" + str + "\"")

>>>?str.decode('utf-8')

'费脑子'

请问如何用C语言实现汉字，和Unicode编码的转换？

字转换：wctomb、mbtowc，wc 指 Wide charactor，mb 指 Multi-byte。\r\n字符串转换：wcstombs、mbstowcs，wcs 和 mbs 的 s 指 string。\r\n\r\n这 4 个函数是 C 标准函数库函数中的。如果只是在 Windows 平台下编程，可直接调用 Windows API 函数 WideCharToMultiByte 和 MultiByteToWideChar 实现。但是如果调用标准库函数的话，在 Linux 下也是有效的。调用标准库函数，首先必须包含 locale.h 并调用 setlocale(LC_ALL, "") 后才能正确转换。Windows 下的 Multi-byte 是 ANSI 编码的，Wide charactor 是 Unicode (UTF-16) 编码，而 Linux 下的 Multi-byte 是 UTF-8 编码的，Wide charactor 是 Unicode (UTF-32) 编码。\r\n\r\n#include \r\n#include \r\n#include \r\n\r\nint main(void)\r\n{\r\n char str[12];\r\n wchar_t wstr[] = { 0x52B3, 0x788C, 0 };\r\n setlocale(LC_ALL, "");\r\n wcstombs(str, wstr, sizeof(str)/sizeof(char));\r\n printf("%s", str);\r\n return 0;\r\n}

VB中如何将汉字转换为Unicode代码？

ASC(字符) 返回ascii码
给你一个函数
它会返回传入的字符串所有ASCII码
Function AscStr(ByVal txt As String) As String
Dim ascii As String
For i = 1 To Len(txt)
ascii = ascii & Asc(Mid$(txt, i, 1)) & "$"
Next
AscStr = ascii
End Function
Private Sub Form_Load()
MsgBox AscStr("我们是")
End Sub
如果你要对返回的结果进行处理
请用split函数
例如
Function AscStr(ByVal txt As String) As String
Dim ascii As String
For i = 1 To Len(txt)
ascii = ascii & Asc(Mid$(txt, i, 1)) & "$"
Next
AscStr = ascii
End Function
Private Sub Form_Load()
Dim a
a = Split(AscStr("这个是AscStr函数测试用例"), "$")
For i = 0 To UBound(a)
If a(i) <> "" Then
MsgBox Chr$(a(i)) & "(" & a(i) & ")"
End If
Next
End Sub
傲游应该是IE的核心吧应该不是傲游的功能
AscW(字符) 返回ascii码
Option Explicit
Dim sTemp As String
Dim yTemp() As Byte
Private Sub Form_Load()
Text1 = "汉字转换为"
sTemp = Text1
yTemp = StrConv(sTemp, vbFromUnicode)
sTemp = StrConv(yTemp, vbUnicode)
Text2 = sTemp
End Sub
把ascii码转化成汉字
Chr 函数
返回 String，其中包含有与指定的字符代码相关的字符
Private Sub Command1_Click()
Text1 = Chr(-17734) '显示汉
End Sub
AscW(字符)
回答补充：用Chr()函数把ascii码转化成汉字
用ChrW()函数把Unicode码转化成汉字
（还有之前说的
AscW()函数返回值为负的时候，应加上65536 才得到汉字实际的Unicode码）
----------------------------------------------------------------------------------------
求汉字的Unicode代码用AscW()函数
AscW("汉")=27721
求汉字的ASCII码用Asc()函数返回一个负数值
如Asc("汉")=-17734
PS:PS:改进了下可转化多个汉字
在窗体上建三个text控件，
功能：text1中按个输入汉字后 text2中按个显示汉字的Unicode代码 text3中显示汉字的ASCII码
原代码如下：
Private Function change(s As String) As String
change = AscW(s)
If change < 0 Then
change = change + 65536
End If
End Function
Private Function change2(s As String) As String
change2 = Asc(s)
End Function
Private Sub Text1_Change()
For i = 1 To Len(Text1.Text)
s = s & change(Mid(Text1.Text, i, 1)) & " "
Next
Text2.Text = s
s = ""
For i = 1 To Len(Text1.Text)
s = s & change2(Mid(Text1.Text, i, 1)) & " "
Next
Text3.Text = s
End Sub
补充：a 的ASCII码是97
Asc函数返回的是字符串首字母的ASCII码（如字符串只一个字符，即返回该字符的ASCII码）
Asc 函数

返回一个 Integer，代表字符串中首字母的字符代码。
语法
Asc(string)
必要的 string 参数可以是任何有效的字符串表达式。如果 string 中没有包含任何字符，则会产生运行时错误。
PSPS: VB里目前我还没找到能将之转换成把汉字转换成西欧文编码的函数不敢断言没有（有估计也很难找我搜了好多关键字都没找到）
还有不只是遨游浏览器，一般的IE浏览器也有此功能
查看——编码——其他——最下面那小三角号——西欧(ISO)

怎么把汉字转换成unicode编码

unicode编码不需要转换成汉字，因为unicode就是和字符关联的终极编码。
windows中只有unicode码可以和字符直接关联，也就是使用国际标准的unicode字符集。
中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030)，日文系统就是JIS，不同语言版本的windows都有不同的默认内码，这是每个国家的标准化管理局规定的。
然后就是页码表的概念，所谓页码表就是把一个用系统默认编码（比如gbk，gb2312）表示的字符映射到对应unicode编码，而每个unicode编码对应着唯一确定的字符。这样就完成了地域性编码到国际标准码再到字符的对应关系。
在控制面板->区域和语言选择->高级，里面可以看到window提供的所有页码表。

如何在vb中将汉字转化成unicode

VB本身就是使用Unicode编码格式的，只要能在VB中正常显示出来的字符串都肯定是Unicode编码的。如果要把ANSI格式的字符串（在VB直接显示会出现乱码）转化为Unicode，可以这样（假定变量s储存的就是要转换的字符串）：
s = StrConv(s, vbUnicode)

unicode编码怎么转换成中文显示

unicode编码不需要转换成汉字，因为unicode就是和字符关联的终极编码。 windows中只有unicode码可以和字符直接关联，也就是使用国际标准的unicode字符集。中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030)，日文系统就是JIS..

unicode不能对汉字进行编码吗

能。Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。
在Unicode中：汉字“字”对应的数字是23383（十进制），十六进制表示为5B57。在Unicode中，我们有很多方式将数字23383表示成程序中的数据，包括：UTF-8、UTF-16、UTF-32。UTF是“Unicode Transformation Format”的缩写，可以翻译成Unicode字符集转换格式，即怎样将Unicode定义的数字转换成程序数据。
扩展资料：
Unicode编码将世界上所有的符号都纳入其中，无论是英文、日文、还是中文等，大家都使用这个编码表，不会出现编码不匹配现象。每个符号对应一个唯一的编码，乱码问题不存在。
Unicode当然是一个很大的集合，现在的规模可以容纳100多万个符号。每个符号的编码都不一样，比如，U+0639表示阿拉伯字母Ain，U+0041表示英语的大写字母A，“汉”这个字的Unicode编码是U+6C49。
Unicode固然统一了编码方式，但是它的效率不高，比如UCS-4(Unicode的标准之一)规定用4个字节存储一个符号，那么每个英文字母前都必然有三个字节是0，这对存储和传输来说都很耗资源。
参考资料：
百度百科-Unicode

如何将GB2312和Unicode的汉字编码互相转换

中文字符在记事本中保存时，另存为unicode格式就是万国码字符集格式；另存为ANSI格式便是GB2312字符集格式。

怎么将汉字转换成unicode

unicode编码不需要转换成汉字，因为unicode就是和字符关联的终极编码。windows中只有unicode码可以和字符直接关联，也就是使用国际标准的unicode字符集。中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030)，日文系统就是JIS，不同语言版本的windows都有不同的默认内码，这是每个国家的标准化管理局规定的。然后就是页码表的概念，所谓页码表就是把一个用系统默认编码（比如gbk，gb2312）表示的字符映射到对应unicode编码，而每个unicode编码对应着唯一确定的字符。这样就完成了地域性编码到国际标准码再到字符的对应关系。在控制面板->区域和语言选择->高级，里面可以看到window提供的所有页码表。

← 上一篇: vbs蓝屏10秒代码,求一个超毒无比的vbs代码，最好能破坏电脑和安全模式也修复不了的vbs代码。一定要超毒的。下一篇: 排序算法,排序算法概述→

汉字与unicode编码转换,unicode编码怎么转换成中文显示

汉字与unicode编码转换,unicode编码怎么转换成中文显示详细介绍

相关文章：

文章数据信息: