MySQL修改字符集的实战教程
前言:
在MySQL中,系统支持诸多字符集,不同字符集之间也略有区别。目前最常用的字符集应该是utf8和utf8mb4了,相比于utf8,utf8mb4支持存储emoji表情,使用范围更广。本篇文章将会介绍utf8修改成utf8mb4字符集的方法。
1.utf8和utf8mb4字符集介绍
字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集(Characterset)是多个字符的集合。
MySQL中字符集可以作用于四个级别,分别是:服务器级别、数据库级别、表级别、列级别。服务器级别的比较规则由character_set_server参数控制,如果创建数据库、表、列时没有显式的指定字符集,则会继承上一级的字符集。
MySQL5.7及之前版本默认的字符集是latin1,MySQL8.0版本默认的字符集是utf8mb4。不过使用latin1容易导致乱码,所以还是utf8和utf8mb4用途最广泛。utf8其实是utf8mb3的别名,只使用1~3个字节表示字符。utf8mb4使用1~4个字节表示字符,能够存储更多的emoji表情及任何新增的Unicode字符。utf8mb4兼容utf8,且比utf8能表示更多的字符,是utf8字符集的超集。所以现在一些新的业务建议将数据库的字符集设置为utf8mb4,特别是有表情存储需求时。
2.修改字符集方法
目前的互联网业务对emoji表情存储的需求越来越多,比如昵称、评论内容等都要支持表情符号,这个时候如果数据库字段用的是utf8字符集,则会报如下错误:
java.sql.SQLException:Incorrectstringvalue:'\xF0\x9F\x92\x95\xF0\x9F...'for column…………
为了业务需求,我们需要将数据库字符集改为utf8mb4,好在utf8mb4是utf8的超集,除了将编码改为utf8mb4外不需要做其他转换。这里简单讲下修改方法。
系统参数修改
首先应该修改系统字符集参数,这样以后创建的库表默认字符集就是utf8mb4了。找到配置文件,添加或修改以下参数:
vi/etc/my.cnf [mysqld] character-set-server=utf8mb4 collation-server=utf8mb4_general_ci skip-character-set-client-handshake #忽略应用连接自己设置的字符编码,保持与全局设置一致 [client] default-character-set=utf8mb4 [mysql] default-character-set=utf8mb4
修改数据库字符集
对于已经创建的数据库,如果原来是utf8字符集,则可以这么修改:
#设置数据库字符集编码 ALTERDATABASE`dbname`CHARACTERSETutf8mb4COLLATEutf8mb4_general_ci; #示例 mysql>showcreatedatabasetestdb; +----------+-----------------------------------------------------------------+ |Database|CreateDatabase| +----------+-----------------------------------------------------------------+ |testdb|CREATEDATABASE`testdb`/*!40100DEFAULTCHARACTERSETutf8*/| +----------+-----------------------------------------------------------------+ 1rowinset(0.00sec) mysql>alterdatabase`testdb`CHARACTERSETutf8mb4COLLATEutf8mb4_general_ci; QueryOK,1rowaffected(0.01sec) mysql>showcreatedatabasetestdb; +----------+--------------------------------------------------------------------+ |Database|CreateDatabase| +----------+--------------------------------------------------------------------+ |testdb|CREATEDATABASE`testdb`/*!40100DEFAULTCHARACTERSETutf8mb4*/| +----------+--------------------------------------------------------------------+ 1rowinset(0.00sec)
修改表及字段字符集
同样的,对于已经创建的表,修改全局及数据库的字符集并不会影响原表及字段的字符集。原有的utf8表可以采用如下方法修改:
#修改表字符集 altertable`tb_name`defaultcharactersetutf8mb4; #修改某字段字符集 altertable`tb_name`modifycol_namevarchar(20)charactersetutf8mb4; #同时修改表及字段字符集 altertable`tb_name`CONVERTTOCHARACTERSETutf8mb4COLLATEutf8mb4_general_ci; #如果某个库里面表比较多可以拼接出要执行的批量修改语句 SELECT CONCAT('ALTERTABLE',TABLE_NAME,'CONVERTTOCHARACTERSETutf8mb4COLLATEutf8mb4_general_ci;') FROM information_schema.`TABLES` WHERE TABLE_SCHEMA='testdb';
3.一些建议
看起来修改方法挺简单,不过对于生产环境还是要格外小心。特别是修改字段字符集时,会加锁,阻止写操作,对于大表执行下来也是很慢的,可能对线上业务造成影响。
如果你的数据库比较小,用以上方法应该问题不大。对于线上环境,若要修改字符集,一定要做好评估,最好可以在业务低峰期停机修改,修改前一定要先备份。若无停机时间,可以考虑先在备库修改,然后再主备切换,不过这样做会更麻烦。
有条件的话也可以再准备一个空实例,先导入表结构,改成utf8mb4字符集后再导入数据。这也是一种方法,不过也可能需要停机切换。
以上就是MySQL修改字符集的方法的详细内容,更多关于MySQL修改字符集的资料请关注毛票票其它相关文章!