位置: 编程技术 - 正文

MySQL乱码问题终极指南(mysql乱码问题怎么解决)

编辑:rootadmin

推荐整理分享MySQL乱码问题终极指南(mysql乱码问题怎么解决),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:mysql数据库出现乱码,mysql乱码问题怎么解决,mysql数据库出现乱码,mysql出现乱码,mysql解决乱码,mysql解决乱码,mysql中文乱码解决方法,mysql数据库出现乱码,内容如对您有帮助,希望把文章链接给更多的朋友!

mysql的字符集设置众多,从客户端到连接到结果集,从服务器到库到表到列,都可以设置字符集,灵活很强大,但就是很容易出问题,如果不了解其机制,很容易就出现乱码问题。

为了让大家尽量在工作中少受或者不受乱码的困扰,这里我结合之前其它同学在论坛的发帖,并结合自己的理解和实践,详细分析总结了一下,以飨各位看官。

关于字符集和乱码的基础知识这里就不详细说明了(请自行搜索),但有一个问题需要特别强调一下:乱码是怎么产生的?这个问题相信很多同学都是模棱两可,或者没有认真想过,反正理解就是”字符编码“不对导致乱码,但没有真正想过为什么”字符编码“会导致乱码。答案其实很简单:“转换导致乱码”!根据这个原则来判断,各种情况就很简单了:

1)数据传送过程中不会导致乱码2)数据存储不会导致乱码3)数据输入和输出(包括显示)可能导致乱码4)数据接收和发送可能导致乱码

更详细的解释:转换导致乱码是指本来是A字符集的数据被当成了B字符集进行解析,而不是说正确的A字符集转换为B字符集。例如:如下mysql字符处理机制流程图中,mysql客户端发送的实际上是2个gbk字符(4字节),但character_set_connection设置了utf8,于是mysql服务器将收到的4字节gbk数据按照utf8解析,得到1个中文字符+1个字节,这时就产生乱码了;

如果character_set_connection 设置为gbk,mysql服务器收到数据后按照gbk解析,得到两个正确的中文,然后再转换为这两个中文对应的utf8编码,这就不会产生乱码。)

【mysql的字符处理机制】

详细的处理机制如下图:

我们模拟一下一条数据从插入到读取的处理流程,看看在整个流程中,字符集是如何辗转腾挪的。【插入流程】1. 客户端设定了自己的编码(character_set_client),接收用户的输入;2. 客户端将用户的输入“转换”成连接的编码(character_set_connection) =====> 第一次转换3. 客户端将转换后的数据发送给服务器; =====> 传输不会导致编码转换4. 服务器收到客户端的数据,再判断数据列的字符集,进行字符转换 =====> 第二次转换5. 服务器将数据存储(例如磁盘) =====> 存储不会导致编码转换

【读取流程】略去前面的sql语句处理流程,从数据读取开始1. 服务器从存储(例如磁盘)读取数据 =====> 存储不会导致编码转换,因此从存储读取也不需要2. 服务器判断当前连接返回结果的字符集(character_set_results), 将读取的数据转换为结果集要求的数据 =====> 逆向的第一次转换,对应正向的第二次编码转换3. 服务器将数据发送给客户端 =====> 传输不会导致编码转换4. 客户端收到服务器的数据,根据客户端的字符集(character_set_client)进行编码转换 =====> 逆向第二次转换,对应正向第一次编码转换5. 客户端显示数据 =====> 你能看到乱码的时候

有了这个流程,我们就很容易定位乱码可能产生的地方,以及产生乱码的字符集配置究竟是哪个了。理想的情况是整个流程中,所有涉及字符转换的地方都不需要转换,这样就不会产生乱码了。

有了上面的理论分析后,我们再结合一个乱码的抓包实例,加深理解,其中有一些问题,请大家思考一下,看看是否真的理解了。

环境:+--------------------------+-----------------------------------------------------+| Variable_name | Value |+--------------------------+-----------------------------------------------------+| character_set_client | latin1 || character_set_connection | latin1 || character_set_database | utf8 || character_set_filesystem | binary || character_set_results | latin1 || character_set_server | utf8 |

测试语句是插入一个中文字符“你”,其utf8编码为"0xE4 0xBD 0xA0",

1. latin1发送包

思考一下1:为什么客户端和连接都设置了latin1,但最终发送的是正确的utf8编码呢?

2. latin1接收包

MySQL乱码问题终极指南(mysql乱码问题怎么解决)

思考一下2:为什么接收到的还是正确的utf8编码?

3. latin1不显示乱码

思考一下3:为什么latin1显示了正确的utf8字符?

4. utf8接收包

思考一下4:为什么连接的字符集和数据库的字符集设置成一样了,接收的数据反而不是utf8了?(请与latin1接收数据包对比)

5. utf8显示包

思考一下5:为什么连接的字符集和数据库的字符集设置成一样了,显示反而乱码了?

怎么样,上面的思考题是否都有答案了,如果没有,相信下面这幅图能够帮助你:

这个抓包案例的字符变化图解:

附:mysql字符编码操作技巧【查看字符集设置】

【修改字符集设置】服务器的配置在服务器建立的时候就由DBA设置好了,不推荐后续再改通过SET NAMES utf8命令同时设置character_set_client/character_set_connection/character_set_results的字符集建议所有配置都设置成utf8

【问题答案】

思考一下1:为什么客户端和连接都设置了latin1,但最终发送的是正确的utf8编码呢?客户端设置了latin1,而我的语句是从notepad++中写好的,是utf8格式的;中文utf8是3个字节,而latin1是按照单个字节解析的,虽然进行了转换,但不会导致二进制内容的变化,但实际上mysql客户端认为我输入了3个latin1字符;如果客户端设置的编码是2个字节的gbk,这时转换就会发生乱码,utf8的3个字节会被转换为1个gbk字符(可能是乱码,也可能不是乱码)加上一个西欧字符(小于就是英文,大于就是其它西欧文)

思考一下2:为什么接收到的还是正确的utf8编码?这是因为mysql服务器从将数据从“列”的编码(utf8)转换为latin1了,而列存储的数据并不是真正的utf8的中文“你”对应的"0xe4 0xbd 0xa0",而是后面抓包看到的“c3a4 c2bd c2a0”(6个字节),mysql服务器将utf8的c3a4转换为latin1的0xe4,c2bd转换为0xbd, c2a0转换为0xa0

思考一下3:为什么latin1显示了正确的utf8字符?因为mysql客户端收到了mysql服务器转换后的"0xe4 0xbd 0xa0",并把这个数据当做latin1的3个字符处理,然后抛给终端(我的是SecureCRT),SecureCRT又把这三个latin1当做uft8处理,结果中文的“你”就显示出来了。

思考一下4:为什么连接的字符集和数据库的字符集设置成一样了,接收的数据反而不是utf8了?(请与latin1接收数据包对比)字符集都一样的情况下,整个流程中不需要进行编码转换,直接将存储的“c3a4 c2bd c2a0”返回给客户端

思考一下5:为什么连接的字符集和数据库的字符集设置成一样了,显示反而乱码了?参考思考4,客户端收到数据后也直接抛给终端显示,终端认为是两个utf8字符,并且找到了对应字符并显示,但我们看不懂,所以知道是乱码了,但这两个字符显示并没有错,如果真正找不到字符,可能会显示问号或者字符集规定的缺省符号。

标签: mysql乱码问题怎么解决

本文链接地址:https://www.jiuchutong.com/biancheng/321307.html 转载请保留说明!

上一篇:MYSQL导入导出sql文件简析(MySQL导入导出命令)

下一篇:Mysql启动的方式(四种)(mysql的启动方法(windows 平台))

  • 已认证进项税额转出会计分录账务处理
  • 自行研发的无形资产不确认递延所得税
  • 增值税发票确认平台怎么认证发票
  • 海运报文是什么意思
  • 代扣代缴增值税是什么意思
  • 有限责任公司的股东人数为多少
  • 预收账款期末余额计算公式
  • 小规模纳税人增值税减免账务处理
  • 京东开专用发票需要用公户付款吗
  • 认购股份有什么好处
  • 个人所得税申报操作流程
  • 个税累计扣除项目合计2712.5是什么
  • 税务大厅可以开票吗
  • 以合并方式成立的新企业,新启用
  • 固定资产残值怎么计算出来的
  • 购买东西进项税在借方还是贷方
  • 一般存款账户可以转账给个人吗
  • 如何查询当月社保和公积金是否缴纳
  • 小规模纳税人需要汇算清缴吗
  • 印花税的计税依据含税吗
  • 小微企业销售额含税吗
  • 普通纳税人的条件
  • 一般纳税人预缴税款几个点
  • 电子税务局变更经营地址怎么操作
  • 赠送给客户的商品怎么做账
  • 预付的各种押金
  • 苹果iphone支持在哪
  • 非流动资产基金是什么意思
  • 作废的凭证不能恢复吗
  • 特许经营企业广告语
  • 最薄的平板电脑是哪种
  • 贝特阿斯品牌介绍
  • 员工冲借款应该怎么做账
  • PHP:clearstatcache()的用法_Filesystem函数
  • 质量事故责任书
  • 世界上最贵的鼠标是用什么做的
  • php中require和include是用来做什么的
  • 社保调整基数后 两个月没变化
  • 建安企业开具增值税专用发票要求
  • hive dt
  • ausearch命令
  • 发行债券支付的费用要减吗
  • 哪些费用发票可以抵扣企业所得税
  • 临时工交押金会扣钱吗
  • 如何理解符合立案标准的,行政机关应当及时立案
  • 帝国cms采集发布的文章链接打不开
  • 怎么在电子税务局查询进项发票
  • 计提工资是什么时候计提
  • 专利技术资本化
  • 社保信息修改到哪里办理
  • SQL中DATEADD和DATEDIFF的用法示例介绍
  • 计入委托加工物资成本的消费税
  • 公司抽奖奖品设置
  • 车间管理人员的福利费计入什么科目
  • 装修费一定要摊销吗
  • 增值税期末留抵税额是什么意思
  • 金蝶固定资产管理
  • 预算凭证是什么
  • 对方公司收钱不开发票怎么办
  • 出售固定资产属于什么收入
  • 什么是现金等价物列举
  • mysql查询条件不区分大小写
  • Windows10安装包下载
  • bios1962错误
  • 苹果15手机价格和图片颜色
  • mac osx 10.8
  • WINDOWS操作系统属于什么操作系统
  • windows没有
  • win10系统怎么新建磁盘
  • linux cp的用法
  • win10升级win1
  • Android游戏开发打砖块
  • linux命令有啥用
  • python3m
  • 猫的所有视频
  • python 进阶
  • 通用税务采集软件有哪些
  • 增值税消费税申报比对不符怎么办
  • 现行的企业所得税率是多少
  • 社保工资申报错了可以重新申请吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设