delete后加 limit是个好习惯么-轻识

作者：陈哈哈

blog.csdn.net/qq_39390545/article/details/107519747

在业务场景要求高的数据库中，对于单条删除和更新操作，在delete和update后面加limit 1绝对是个好习惯。

比如，在删除执行中，第一条就命中了删除行，如果SQL中有limit 1；这时就return了，否则还会执行完全表扫描才return。效率不言而喻。

那么，在日常执行delete时，我们是否需要养成加 limit 的习惯呢？是不是一个好习惯呢？

在日常的SQL编写中，你写delete语句时是否用到过以下SQL？

delete from t where sex = 1 limit 100;

你或许没有用过，在一般场景下，我们对 delete 后是否需要加 limit 的问题很陌生，也不知有多大区别，今天带你来了解一下，记得mark！

写在前面，如果是清空表数据建议直接用truncate，效率上truncate远高于delete，应为truncate不走事务，不会锁表，也不会生产大量日志写入日志文件；truncate table table_name 后立刻释放磁盘空间，并重置auto_increment的值。

delete删除不释放磁盘空间，但后续insert会覆盖在之前删除的数据上。详细了解:

★
https://blog.csdn.net/qq_39390545/article/details/107144859
”

下面只讨论delete场景，首先，delete后面是支持limit关键字的，但仅支持单个参数，也就是[limit row_count]，用于告知服务器在控制命令被返回到客户端前被删除的行的最大值。

delete limit语法如下：

（值得注意的是，当需要用到order by排序时，必须order by + limit联用，否则order by 就会被优化器优化掉，被认为无意义。）

delete [low_priority] [quick] [ignore] from tbl_name
  [where ...]
    [order by ...]
      [limit row_count]

加limit的的优点：

以下面的这条SQL为例：

delete from t where sex = 1;

1. 降低写错SQL的代价，就算删错了，比如limit 500,那也就丢了500条数据，并不致命，通过binlog也可以很快恢复数据。
2. 避免了长事务，delete执行时MySQL会将所有涉及的行加写锁和Gap锁（间隙锁），所有DML语句执行相关行会被锁住，如果删除数量大，会直接影响相关业务无法使用。
3. delete数据量大时，不加limit容易把cpu打满，导致越删越慢。

针对上述第二点，前提是sex上加了索引，大家都知道，加锁都是基于索引的，如果sex字段没索引，就会扫描到主键索引上，那么就算sex = 1 的只有一条记录，也会锁表。

对于delete limit 的使用，MySQL大佬丁奇有一道题：

如果你要删除一个表里面的前 10000 行数据，有以下三种方法可以做到：

第一种，直接执行 delete from T limit 10000;
第二种，在一个连接中循环执行 20 次 delete from T limit 500;
第三种，在 20 个连接中同时执行 delete from T limit 500。

你先考虑一下，再看看几位老铁的回答：

Tony Du：

方案一，事务相对较长，则占用锁的时间较长，会导致其他客户端等待资源时间较长。
方案二，串行化执行，将相对长的事务分成多次相对短的事务，则每次事务占用锁的时间相对较短，其他客户端在等待相应资源的时间也较短。这样的操作，同时也意味着将资源分片使用（每次执行使用不同片段的资源），可以提高并发性。
方案三，人为自己制造锁竞争，加剧并发量。
方案二相对比较好，具体还要结合实际业务场景。

肉山：

不考虑数据表的访问并发量，单纯从这个三个方案来对比的话。

第一个方案，一次占用的锁时间较长，可能会导致其他客户端一直在等待资源。
第二个方案，分成多次占用锁，串行执行，不占有锁的间隙其他客户端可以工作，类似于现在多任务操作系统的时间分片调度，大家分片使用资源，不直接影响使用。
第三个方案，自己制造了锁竞争，加剧并发。

至于选哪一种方案要结合实际场景，综合考虑各个因素吧，比如表的大小，并发量，业务对此表的依赖程度等。

～嗡嗡：

1. 直接delete 10000可能使得执行事务时间过长
2. 效率慢点每次循环都是新的短事务，并且不会锁同一条记录，重复执行DELETE知道影响行为0即可
3. 效率虽高，但容易锁住同一条记录，发生死锁的可能性比较高

怎么删除表的前 10000 行。比较多的朋友都选择了第二种方式，即：在一个连接中循环执行 20 次 delete from T limit 500。确实是这样的，第二种方式是相对较好的。

第一种方式（即：直接执行 delete from T limit 10000）里面，单个语句占用时间长，锁的时间也比较长；而且大事务还会导致主从延迟。

第三种方式（即：在 20 个连接中同时执行 delete from T limit 500），会人为造成锁冲突。

这个例子对我们实践的指导意义就是，在删除数据的时候尽量加 limit。这样不仅可以控制删除数据的条数，让操作更安全，还可以减小加锁的范围。所以，在 delete 后加 limit 是个值得养成的好习惯。

好了，本文就带你了解这些，如果有相关疑问和好想法，请在下方留言，方便和小伙伴儿们一起讨论。

END

欢迎添加程序汪个人微信 itwang007 进粉丝群或围观朋友圈


往期资源  需要请自取
Java项目分享 最新整理全集，找项目不累啦 03版
卧槽！字节跳动《算法中文手册》火了，完整版 PDF 开放下载！
字节跳动总结的设计模式 PDF 火了，完整版开放下载！

堪称神级的Spring Boot手册，从基础入门到实战进阶

卧槽！阿里大佬总结的《图解Java》火了，完整版PDF开放下载！
喜欢就"在看"呗^_^