UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到4个字节编码Unicode字符。用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。
C++编码时有时会用到修改utf-8文件,c++11新特性里给了新的解决办法。
包含头文件#include <codecvt>
#include <fstream>
#include <string>
#include <codecvt>
#include <iostream>
using namespace std;
int main(int argc, char *argv[])
{
std::wstring str = L"123,abc:我是谁!";
std::wstring_convert<std::codecvt_utf8<wchar_t>> conv;
std::string narrowStr = conv.to_bytes(str);
{
std::ofstream ofs("d:\\test.txt"); //文件是utf8编码
ofs << narrowStr;
}
std::ifstream ifs(L"d:\\test.txt");
while (!ifs.eof())
{
string line;
getline(ifs, line);
wstring wb = conv.from_bytes(line);
wcout.imbue(locale("chs")); //更改区域设置 只为控制台输出显示
wcout << wb << endl;
}
}