如何优化sql中的orderBy?--688IT编程网

如何优化sql中的orderBy？

在使⽤数据库进⾏数据查询时，难免会遇到基于某些字段对查询的结果集进⾏排序的需求。在sql中通常使⽤orderby语句来实现。将需要排序的字段放到该关键词后，如果有多个字段的话，就⽤","分割。

select*from table t order lumn2;

上⾯的sql表⽰查询表table中数据，然后先按照column1排序，如果column1相同的话，在按照column2排序，排序的⽅式默认是降序。当然排序⽅式也是可以指定的。在被排序字段后添加 DESC,ASE，分别表⽰降序和升序。

使⽤该orderby可以很⽅便的实现⽇常的排序操作。使⽤的多了，不知道你有没有遇到过这种场景：有时候使⽤orderby后，sql执⾏效率⾮常慢，有时候却⽐较快，由于整天被curd缠⾝，也没有时间研究，反正就是觉得很神奇。趁这个周末⽐较闲，就来研究

下，mysql中orderby是怎么实现的。

为了⽅便描述，我们先建⽴⼀个数据表 t1，如下：

CREATE TABLE`t1`(

`id`int(11)NOT NULL not null auto_increment,

`a`int(11)DEFAULT NULL,

`b`int(11)DEFAULT NULL,

`c`int(11)DEFAULT NULL,

PRIMARY KEY(`id`),

KEY`a`(`a`)USING BTREE

)ENGINE=InnoDB;

并插⼊数据：

insert into t1 (a,b,c)values(1,1,3);

insert into t1 (a,b,c)values(1,4,5);

insert into t1 (a,b,c)values(1,3,3);

insert into t1 (a,b,c)values(1,3,4);

insert into t1 (a,b,c)values(1,2,5);

insert into t1 (a,b,c)values(1,3,6);

为了使索引⽣效，插⼊10000⾏7,7,7，⽆关数据，数据量少的情况下，会直接全表扫描

insert into t1 (a,b,c)values(7,7,7);

我们现在需要查 a=1的所有记录，然后按照b字段进⾏排序。

查询sql为

select a,b,c from t1 where a =1order by b limit2;

为了防⽌在查询过程中全表扫描，我们在字段a上添加了索引。

⾸先我们先通过语句

explain select a,b,c from t1 where a =1order by b lmit 2;

查看sql的执⾏计划，如下所⽰：

在extra中我们可以看到出现了Using filesort，这个表⽰该sql执⾏过程中，执⾏了排序操作，排序操作在 sort_buffer中完

成，sort_buffer是mysql分配给每个线程的⼀个内存缓冲区，该缓冲区专门⽤来完成排序，⼤⼩默认是1M，其⼤⼩由变量 sort_buffer_size 进⾏控制。

sql优化的几种方式

mysql在对orderby进⾏实现时，根据放⼊到sort_buffer中的字段内容不同，进⾏了两种不同实现⽅式：全字段排序和rowid排序。

全字段排序

⾸先我们先通过⼀张图整体看⼀下sql执⾏过程：

mysql先根据查询条件确定需要排序的数据集，也就是表中 a=1的数据集，即主键id从1到6的这些记录。

整个sql的执⾏的过程如下：

1.创建并初始化sort_buffer，并确定需要放到该缓冲区中的字段，也就是a,b,c这三个字段。

2.从索引树a中到第⼀个满⾜a=1的主键id，也就是id=1。

3.回表到id索引，取出整⾏数据，然后从整⾏数据中，取出a,b,c的值，放⼊到sort_buffer中。

4.从索引a中按照顺序到下⼀个a=1的主键id。

5.重复步骤3和步骤4，直到获取到最后⼀个a=1的记录，也就是主键id=5。

6.此时满⾜条件a=1的所有记录的 a,b,c字段，全部读放到了sort_buffer中，然后，对这些数据按照b的值进⾏进⾏排序，排序的⽅式是快速排序。就是那个⾯试经常⾯到的快速排序，时间复杂度为log2n的快速排序。

7.然后从排序后的结果集中取出前2⾏数据。

上⾯是就是msql中orderby的执⾏流程。因为放⼊到sort_buffer中的数据是需要输出的全部字段，所以这种排序被称为全排序。

看到这⾥不知道你是否会有疑问？如果需要排序的数据量很⼤的话，sort_buffer装不下怎么办？

的确，如果a=1的数据⾏特别多，且需要存放到sort_buffer中的字段⽐较多，可能不⽌a,b,c三个字段，有些业务可能需要输出更多字段。那么默认⼤⼩只有1M的sort_buffer很可能容纳不下。

当sort_buffer容纳不下的时候，mysql会创建⼀批临时的磁盘⽂件来辅助排序。默认情况下会创建12个临时⽂件，将需要排序的数据分

成12份，每⼀份单独排序，形成12个内部数据有序的⽂件，然后把这12个有序⽂件在合并成⼀个有序的⼤⽂件，最终完成数据的排序。

基于⽂件的排序，相⽐基于内存的排序，排序效率要低很多，为了提⾼排序的效率，应该尽量避免基于⽂件的排序，要想避免基于⽂件排序，就需要让sort_buffer可以容纳需要排序的数据量。

所以对于sort_buffer容纳不下的情况，mysql进⾏了优化。就是在排序时候，降低存放到sort_buffer中的字段个数。

具体优化⽅式，就是下⾯的rowId排序

RowId 排序

在全字段排序实现中，排序的过程中，要把需要输出的字段全部放到sort_buffer中，当输出的字段⽐较多的时候，可以放到sort_buffer中的数据⾏就会变少。也就增⼤了sort_buffer⽆法容纳数据的风险，直⾄出现基于⽂件的排序。

rowId排序对全字段排序的优化⼿段，主要是减少了放到sort_buffer中字段个数。

在rowId排序中，只会将需要排序的字段和主键Id放到sort_buffer中。

select a,b,c from t1 where a =1order by b limit2;

在rowId的排序中的执⾏流程如下：

1.初始化并创建sort_buffer，并确认要放⼊的的字段，id和b。

2.从索引树a中到第⼀个满⾜a=1的主键id，也就是id=1。

3.回表主键索引id，取出整⾏数据，从整⾏数据中取出id和b，存⼊sort_buffer中。

4.从索引a中取出下⼀条满⾜a=1的记录的主键id。

5.重复步骤3和4，直到最后⼀个满⾜a=1的主键id，也就是a=6。

6.对sort_buffer中的数据，按照字段b排序。

7.从sort_buffer中的有序数据集中，取出前2个，因为此时取出的数据只有id和b，要想获取a和c字段，需要根据id字段，回表到主键索引中取出整⾏数据，从整⾏数据中获取需要的数据。

根据rowId排序的执⾏步骤，可以发现：相⽐全字段排序，rowId排序的实现⽅式，减少了存放到sort_buffer中的数据量，降低了基于⽂件的外部排序的可能性。

那rowid排序有不⾜的地⽅吗？肯定有的，要不然全字段排序就没有存在的意义了。rowid排序不⾜之处在于，在最后的步骤7中，增加了回表的次数，不过这个回表的次数，取决于limit后的值，如果返回的结果集⽐较⼩的话，回表的次数还是⽐较⼩的。

mysql是如何在全字段排序和rowId排序的呢？其实是根据存放的sort_buffer中每⾏字段的长度决定的，如果mysql认为每次放

到sort_buffer中的数据量很⼤的话，那么就⽤rowId排序实现，否则使⽤全字段排序。那么多⼤算⼤呢？这个⼤⼩的阈值有⼀个变量的值来决定，这个变量就是 max_length_for_sort_data。如果每次放到sort_buffer中的数据⼤⼩⼤于该字段值的话，就使⽤rowId排序，否则使⽤全字段排序。

orderby的优化

上⾯讲述了orderby的两种排序的⽅式，以及⼀些优化策略，优化的⽬的主要就是避免基于磁盘⽂件的外部排序。因为基于磁盘⽂件的排序效率要远低于基于sort_buffer的内存排序。

但是当数据量⽐较⼤的时候，即使sort_buffer⽐较⼤，所有数据全部放在内存中排序，sql的整体执⾏效率也不⾼，因为排序这个操作，本⾝就是⽐较消耗性能的。

试想，如果基于索引a获取到所有a=1的数据，按照字段b，天然就是有序的，那么就不⽤执⾏排序操作，直接取出来的数据，就是符合结果的数据集，那么sql的执⾏效率就会⼤幅度增长。

其实要实现整个sql执⾏过程中，避免排序操作也不难，只需要创建⼀个a和b的联合索引即可。

alter table t1 add index a_b (a,b);

添加a和b的联合索引后，sql执⾏流程就变成了：

1.从索引树(a,b)中到第⼀个满⾜a=1的主键id，也就是id=1。

2.回表到主键索引树，取出整⾏数据，并从中取出a，b，c，直接作为结果集的⼀部分返回。

3.从索引树(a,b)上取出下⼀个满⾜a=1的主键id。

4.重复步骤2和3，直到到第⼆个满⾜a=1的主键id，并回表获取字段a，b，c。

此时我们可以通过查看sql的执⾏计划，来判断sql的执⾏过程中是否执⾏了排序操作。

explain select a,b from t1 where a =1order by b lmit 2;

通过查看执⾏计划，我们发现extra中已经没有了using filesort了，也就是没有执⾏排序操作了。

其实还可以通过覆盖索引，对该sql进⼀步优化，通过在索引中覆盖字段c，来避免回表的操作。

alter table t1 add index a_b_c (a,b,c);

添加索引a_b_c后，sql的执⾏过程如下：

1.从索引树(a,b,c)中到第⼀个满⾜a=1的索引，从中取出a，b，c。直接作为结果集的⼀部分直接返回。

2.从索引(a,b,c)中取出下⼀个，满⾜a=1的记录作为结果集的⼀部分。

3.重复执⾏步骤2，直到查到第⼆个a=1或者不满⾜a=1的记录。

此时通过查看执⾏sql的的还⾏计划可以发现 extra中只有 Using index。

explain select a,b from t1 where a =1order by b lmit 2;

总结

通过对该sql的多次优化，sql的最终执⾏效率和没有排序的普通sql的查询效率基本是⼀样的。之所以可以避免orderby的排序操作，就是利⽤了索引天然有序的特点。但是我们都知道，索引可以加快查询的效率，但是索引的维护成本⽐较⼤，对数据表中数据的新增和修改都会涉及索引的变动，所以索引也不是越多越好，有时候，并不能因为⼀些不常⽤的查询和排序，⽽增加了过多的索引，得不偿失。

688IT编程网

如何优化sql中的orderBy?

发表评论

推荐文章

Linux怎么直接执行PHP脚本文件

php文件写入或追加数据

php中实现文件上传的函数

php文件上传类程序代码

413 request entity too large 解决方法 -回复

热门文章

php中用来导入其他文件的语句

php获取文件后缀名的方法

创建php文件方法

国家电网公司电子商务平台常见问题

【2018-2019】别克英朗说明书-实用word文档 (12页)

诺基亚E71常见问题以及解决方法

HXD3型电力机车故障应急处理

卫星电视中星9号解密方法及节目参数,长期可用

硬盘U盘等启动奶瓶beini详细步骤教程

BT3使用教程

破解网通铁通电信封路由器的几种方法

手把手教你WPA2加密无线网络

教你如何破解搜索到的无线网络

Get清风OD入门系列图文详细教程、破解做辅助起步

java rar破解原理

同余方程在密码学中的应用与破解

无限网络解码

winrar破解方法

macOS终端中的文件加密和解密技巧

rar加密原理

最新文章

php中实现文件上传的函数

413 request entity too large 解决方法 -回复

php实现编辑和保存文件的方法

php 配置文件的用法 -回复

突破php网站上传文件大小限制

php(实现url重写)

标签列表