UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到4个字节编码Unicode字符。用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。
C++编码时有时会用到修改utf-8文件,c++11新特性里给了新的解决办法。
包含头文件#include <codecvt>
- #include <fstream>
- #include <string>
- #include <codecvt>
- #include <iostream>
-
- using namespace std;
-
- int main(int argc, char *argv[])
- {
- std::wstring str = L"123,abc:我是谁!";
-
- std::wstring_convert<std::codecvt_utf8<wchar_t>> conv;
-
- std::string narrowStr = conv.to_bytes(str);
- {
- std::ofstream ofs("d:\\test.txt"); //文件是utf8编码
- ofs << narrowStr;
- }
-
- std::ifstream ifs(L"d:\\test.txt");
- while (!ifs.eof())
- {
- string line;
- getline(ifs, line);
- wstring wb = conv.from_bytes(line);
- wcout.imbue(locale("chs")); //更改区域设置 只为控制台输出显示
- wcout << wb << endl;
- }
- }