tanlijun37的专栏

今天晚上闲来无事,便想用C写个读取unicode文件。我平时都是读取ascii文件,一直没什么问题,,结果在读取unicode文件时遇到一个小问题,特记下来以做一个留念。

先看刚开始的代码:

FILE* file = _wfopen(L"c:\\BOOTEX.LOG", L"r");if (file == NULL){perror("open file errror");system("pause");return 1;}wchar_t line[SIZE1];_wmemset(line, ‘\0’, SIZE1);while(fgetws(line, SIZE1, file) != NULL){//line[strlen(line)-1] = ‘\0’;wprintf(L"%s\n", line);//memset(line, ‘\0’, SIZE1);}fclose(file);运行程序,只输出了一个字符: C。

BOOST.LOG原文件的内容为:Checking file system on C:

单步调试,发现读文件一次后,line的内容为:C\0h\0e\0c\0k\0i\0n\0g\0 \0f\0i\0l\0e\0 \0s\0y\0s\0t\0e\0m\0 \0o\0n\0 \0C\0:\0\0\n\0,原来每个字符占用了两字节,输出了第一个字符 “C"。接下来读文件,line都是以 ‘\0’ 开头,什么都没有输出。

思来想去,查了许多资料也没找到原因。后来实在没办法,我就心想用二进制文件来打开文件试试:FILE* file = _wfopen(L"c:\\BOOTEX.LOG", L"rb"), 没想到unicode文件输出正常了。为什么二进制文件读写就行呢,我暂时也没有想明白。如果大家知道原因的话,请也告诉我。

于是夜莺会在黎明到来之前勇敢的将胸膛顶住蔷薇的刺,

tanlijun37的专栏

相关文章:

你感兴趣的文章:

标签云: