如何处理Linux汉字乱码
在Linux下,你有没有这样的经历,文本文件里面的汉字显示都是正常的,可一插到数据库里就变成了乱码;文件名在本机显示都很正常,一传到服务器上显示的都变成乱码了,最近就差点被这个问题搞死,最后还算小有收获,这里写一下心得:
1,首先要知道文件自己的编码方式,就是文件是以utf8还是以gbk等编码方式存储的,因为这是根本。以xxx.dat文件为例
用vi命令打开xxx.dat文件
在命令行模式:输入set fileencoding 这时会在终端的底部显示文件的编码方式,显示的结果如果是cp936(等同于gbk)或者utf8等,那说明文件的编码方式已经被正确判断出来了,如果是latin1,我们就可能要设定VI的fileencodings这个环境变量的值,打开vimrc这个文件,RHEL的这个文件在/etc目录下、Ubuntu在/etc/vim目录下;或者你也可以建一个~/.vimrc文件
然后把里面merge成:set fileencodings=ucs-bom,utf-8,cp936,gb18030<span style=