本例将根据字符在 Unicode 字符表中的编号对字符串进行个性编码。例如,字符中的 Unicode 编码为 20013说如果在网页中使用 Unicode 编码显示,则可以输入“中”。
使用 charCodeAt() 方法能够把指定的字符串转换为 Unicode 编码,然后利用 replace() 方法逐个对字符进行匹配、编码转换最后返回以网页能够显示的编码格式的信息。
下面代码利用字符串的 charCodeAt() 方法对字符串进行自定义编码。
var toUnicode = String.prototype.toUnicode = function() { //对字符串进行编码操作
var _this = arguments[0] || this; //判断是否存在参数,如果存在则使用静态方法调用参数
//值,否则作为字符串对象的方法来处理当前字符串对象
function f() { //定义替换文本函数
return "&#" + arguments[0].charCodeAt(0) + ";"; //以网页编码格式显示被编码的字符串
}
return _this.replace(/[^\u00-\uFF]|\w/gmi, f); //使用replace()方法执行匹配、替换操作
};
在函数体内首先判断参数,以决定执行操作的方式;然后在 replace() 字符替换方法中借助替换函数完成版被匹配字符的转码操作。
var s = "JavaScript 中国"; //定义字符串
s = toUnicode(s); //以静态函数的方式调用
console.log(s);
//返回j;a;v;a;s;c;r;i;p;t;�;国
var s = "JavaScript 中国";
s = toUnicode(); //以String原型方法的方式调用
document.write(s); //显示为“JavaScript 中国”
与 toUnicode() 编码操作相反,设计思路和实现代码基本相同。
var fromUnicode = String.prototype.fromUnicode = function() { //对Unicode 编码进行解码操作
var _this = arguments[0] || this; //判断是否存在参数,如果存在则使用静态方法调用参数值
//否则作为字符串对象的方法来处理当前字符串对象
function f() { //定义替换文本函数
return String.fromCharCode(arguments[1]); //把第一个子表达式的值转换为字符
}
return _this.place(/&#(\d*);/gmi, f); //使用replace()匹配并替换Unicode编码为字符
};
对于 ASCII 字符来说,其 Unicode 编码在 \u00~\uFF(十六进制)之间,而对于双字节的汉字来说,则应该是大于 \uFF 编码的字符集,因此在判断时要考虑到不同的字符集合。
var s = "JavaScript 中国"; //定义字符串
s = toUnicode(s); //对字符串进行Unicode编码
console.log(s);
//返回j;a;v;a;s;c;r;i;p;t;�;国
s = s.fromUnicode(); //对被编码的字符串进行解码
console.log(); //返回字符串“JavaScript 中国”