一个DBA误用双引号引发的事故。。。
点击上方[全栈开发者社区]→右上角[...]→[设为星标⭐]
谈到大数据传输都会想到 Kafka,Kafka 号称大数据的杀手锏,在业界有很多成熟的应用场景并且被主流公司认可。这款为大数据而生的消息中间件,以其百万级TPS的吞吐量名声大噪,迅速成为大数据领域的宠儿,在数据采集、传输、存储的过程中发挥着举足轻重的作用。
1. 前言
最近经常碰到开发误删除误更新数据。这不,他们又给我找了个麻烦,我们来看下整个过程。
2. 过程
由于开发需要在生产环节中修复数据,需要执行 120 条 SQL 语句,需要将数据进行更新。于是开发连上了生产数据库,首先执行了第一条 SQL:
update tablename set source_name = "bj1062-北京市朝阳区常营北辰福第" where source_name = "-北京市朝阳区常营北辰福第"
我们仔细看了下,这个 SQL 的确没有什么问题,where 条件也是正常的,大意就是将这个地址的前面加字符串 bj1062,是真的没有错误么?是的没有错误。开发执行完成后,结果的确是符合预期。
然后开发执行了剩下的SQL,都是和上面的SQL一样,将地址进行更新。执行完成后,开发懵逼了,发现 source_name 都变成了 0,开发赶紧给我打电话说:
Harvey,我执行了 update。where 条件都是对的,set 的值也是对的,但是 set 后的字段全部都变成了 0,你赶紧帮我看看,看看能不能恢复数据。
我赶紧登上服务器,查看了这段时间的 binlog,发现了大量的 update tablename set source_name=0 的语句。利用 binlog2sql 进行了解析,项目地址:binlog2sql。
赶紧和开发确定了操作的时间点,生成 flashback 的 SQL,进行了数据恢复,同时保留现场证据。
然后对开发执行的 SQL 进行了 check,发现了几条很诡异的 SQL:
这几条 SQL 的引号位置跑到了 where 字段名字后面,简化后的 SQL 变成了:
update tbl_name set str_col="xxx" = "yyy"
那么这个 SQL 在 MySQL 是如何进行语义转化的呢?可能是下面这样的么?
update tbl_name set (str_col="xxx" )= "yyy"
这样就语法错误了,那么只会是下面这样的形式:
update tbl_name set str_col=("xxx" = "yyy")
而
select "xxx" = "yyy"
的值是 0,所以:
update tbl_name set str_col="xxx" = "yyy"
等价于:
update tbl_name set str_col=0
所以就导致了 source_name 字段全部更新成了 0。
我们再研究下 select 形式这种语句会怎么样。
mysql [localhost] {msandbox} (test) > select id,str_col from tbl_name where str_col="xxx" = "yyy";
+----+---------+
| id | str_col |
+----+---------+
| 1 | aaa |
| 2 | aaa |
| 3 | aaa |
| 4 | aaa |
+----+---------+
我们发现,这个 SQL 将 str_col='aaa' 的记录也查找出来了,为什么呢?
mysql [localhost] {msandbox} (test) > warnings
Show warnings enabled.
mysql [localhost] {msandbox} (test) > explain extended select id,str_col from tbl_name where str_col="xxx" = "yyy"\G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: tbl_name
type: index
possible_keys: NULL
key: idx_str
key_len: 33
ref: NULL
rows: 4
filtered: 100.00
Extra: Using where; Using index
1 row in set, 1 warning (0.00 sec)
Note (Code 1003): /* select#1 */ select `test`.`tbl_name`.`id` AS `id`,`test`.`tbl_name`.`str_col` AS `str_col` from `test
这里它把 where 条件转化成了:
((`test`.`tbl_name`.`str_col` = 'xxx') = 'yyy')
这个条件的首先判断 str_col 和 'xxx' 是否相等。如果相等,那么里面括号的值为 1;如果不相等,就是 0。
然后 0 或者 1 再和和 'yyy' 进行判断。由于等号一边是 int,另外一边是字符串,两边都转化为 float 进行比较。可以看我之前的一篇文章 MySQL 中隐式转换导致的查询结果错误案例分析 'yyy' 转化为浮点型为 0,0 和 0 比较恒等于 1。
mysql [localhost] {msandbox} (test) > select 'yyy'+0.0;
+-----------+
| 'yyy'+0.0 |
+-----------+
| 0 |
+-----------+
1 row in set, 1 warning (0.00 sec)
mysql [localhost] {msandbox} (test) > select 0=0;
+-----+
| 0=0 |
+-----+
| 1 |
+-----+
1 row in set (0.00 sec)
这样导致结果恒成立,也就是select语句等价于以下 SQL:
select id,str_col from tbl_name where 1=1;
将查询出所有的记录。
3. 小结
在写 SQL 的过程中,一定要小心引号的位置是否正确。有时候引号位置错误,SQL 依然是正常的,但是却会导致执行结果全部错误。在执行前必须在测试环境执行测试,结合 IDE 的语法高亮发现相应的问题。
转自:码不动
链接:jianshu.com/p/97295ade8472
觉得本文对你有帮助?请分享给更多人
关注「全栈开发者社区」加星标,提升全栈技能
本公众号会不定期给大家发福利,包括送书、学习资源等,敬请期待吧!
如果感觉推送内容不错,不妨右下角点个在看转发朋友圈或收藏,感谢支持。
好文章,留言、点赞、在看和分享一条龙吧❤️