在实际应用中,如果一开始没有正确的设置字符集,在运行一段时间以后,才发现当前字符集不能满足要求,需要进行调整,但又不想丢弃这段时间的数据,这个时候就需要修改字符集。
在《MySQL设置默认字符集和校对规则》一节我们讲到,ALTER DATABASE 或 ALTER TABLE 命令对已经存在的数据没有作用,只对新创建的表或记录生效。如果想修改已存在数据的字符集,需要先将数据导出,经过适当的调整后,再重新导入。
以下模拟的是将 gb2312 字符集的数据库修改成 gbk 字符集的数据库的过程。
1)创建 testset 数据库,设置其字符集为 gb2312,并添加数据。
mysql> CREATE TABLE test.testset( -> id INT(11) DEFAULT NULL, -> name VARCHAR(25) DEFAULT NULL -> )CHARSET=gb2312; Query OK, 0 rows affected (0.10 sec) mysql> INSERT INTO test.testset VALUES (1,'C语言'); Query OK, 1 row affected (0.01 sec) mysql> INSERT INTO test.testset VALUES (2,'Java语言'); Query OK, 1 row affected (0.01 sec) mysql> INSERT INTO test.testset VALUES (3,'Python语言'); Query OK, 1 row affected (0.01 sec)
2)导出 testset 表结构,命令如下:
其中,--default-character-set=gbk 表示以什么字符集连接;-d 表示只导出表结构,不导出数据。
3)打开 testset.sql 文件,修改表结构定义中的字符集为新的字符集,如下图所示。
4)确保表中的记录不再更新,导出所有记录。
5)打开 testdata.sql,将 SET NAMES gb2312 修改成 SET NAMES gbk,如下图所示。
6)使用新的字符集创建新的数据库。
7)创建表,执行 testset.sql。
8)导入数据,执行 testdata.sql。
9)查看 testset 表结构是否修改了字符集,以及表内数据是否丢失或乱码,SQL 语句和运行结果如下:
mysql> SHOW CREATE TABLE test2.testset \G *************************** 1. row *************************** Table: testset Create Table: CREATE TABLE `testset` ( `id` int(11) DEFAULT NULL, `name` varchar(25) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=gbk 1 row in set (0.00 sec) mysql> SELECT * FROM test2.testset; +------+------------+ | id | name | +------+------------+ | 1 | C语言 | | 2 | Java语言 | | 3 | Python语言 | +------+------------+ 3 rows in set (0.00 sec)
注意:选择目标字符集的时候,要注意最好的是原字符集的超集,或者确定比原字符集的字库更大,否则如果目标字符集的字库小于原字符集的字库,那么目标字符集中不支持的字符导入后会变成乱码,丢失一部分数据。