MySQL 深度分页性能急剧下降,该如何优化?

2023-09-14 19:29:44

1、背景

mysql使用select * limit offset, rows分页在深度分页的情况下。性能急剧下降。

例如:select * 的情况下直接⽤limit 600000,10 扫描的是约60万条数据,并且是需要回表60W次,也就是说⼤部分性能都耗在随机访问上,到头来只⽤到10条数据(总共取600010条数据只留10条记录)

2、limit 语法解读

limit用于数据的分页查询,当然也会用于数据的截取,下面是limit的用法:

SELECT *  FROM  table  LIMIT [ offset,]  rows |  rows  OFFSET  offset  
变形

第一种:SELECT * FROM table LIMIT offset, rows # 常用形式

-- 从0开始,截取5条记录,即检索行为1到5
select *  from  table  limit  0, 5
-- 注意: 关键字limit后面的两个参与用逗号分割

第二种:SELECT * FROM table LIMIT rows OFFSET offset

-- 从0开始,截取5条记录,即检索行为1到5
select *  from tb_account  limit  5  offset  0
-- 注意: 使用limit和offset两个关键字,并且各带一个参数,中间没有逗号分割

第三种:SELECT * FROM table LIMIT rows

-- 截取记录的前五行数据,可以理解为offset的默认值为0
select *  from tb_account  limit  5

3、优化方式

1. 模仿百度、谷歌方案(前端业务控制)

类似于分段。我们给每次只能翻100页、超过一百页的需要重新加载后面的100页。这样就解决了每次加载数量数据大 速度慢的问题了

2. 记录每次取出的最大id, 然后where id > 最大id
select *  from table_name  Where  id > 最大 id  limit  10000,  10;

这种方法适用于:除了主键ID等离散型字段外,也适用连续型字段datetime等最大id由前端分页pageNum和pageIndex计算出来。

3. IN获取id
select *  from table_name  where  id  in ( select  id  from table_name  where (  user = xxx ))  limit  10000,  10;
4. join方式 + 覆盖索引(推荐)
select *  from table_name  inner  join (  select  id  from table_name  where ( user = xxx)  limit  10000, 10) b  using ( id)

如果对于有where 条件,又想走索引用limit的,必须设计一个索引,将where 放第一位,limit用到的主键放第2位,而且只能select 主键!

select  id  from  test  where pid =  1  limit  100000, 10;

创建索引:

alter  table  test  add  index idx_pid_id(pid,  id)

4、案例

1. jdbcpagingReader使用方式
//MySqlPagingQueryProvider#
public static String generateLimitSqlQuery(AbstractSqlPagingQueryProvider provider, boolean remainingPageQuery,
        String limitClause) {
    StringBuilder sql =  new StringBuilder();
    sql.append( "SELECT ").append(provider.getSelectClause());
    sql.append( " FROM ").append(provider.getFromClause());
    buildWhereClause(provider, remainingPageQuery, sql);
    buildGroupByClause(provider, sql);
    sql.append( " ORDER BY ").append(buildSortClause(provider));
    sql.append( " " + limitClause);

     return sql.toString();
}

解读:jdbcPageingreader中使用了limit 10 这种写法。默认是查出10条记录。等价于 limit 0,10

2. db索引分区器使用方式

入参1:表名 如test_table

入参2:排序索引字段 可以是主键,也可以是其他索引。需要保证是唯一索引即可。如:id

入参3:主键可手动传入,也可以根据表名计算出来:现在只支持单列主键的。如:id

入参4: 具体表 要分多少块。如:4

-- 使用过程 1. 先统计多少数据
select  count( 1)  as countAllNumber  from test_table;   -- countAllNumber=200
-- 2. 在 根据需要分多少块,算出每块需要包含的数据量,即limit
-- countAllNumber /4 =200/4 =50;  也就是每块的数据量需要包含50个数据。需要算这50个数据的开始节点和结束节点
-- 3. 循环遍历按照主键自增的拍寻方式算出第一块。
-- 3.1 第一块开始节点为0
select  id  from test_table  where  id >= 0  order  by  id  limit  50, 1;  -- 算出第51个元素 如就51;那第一块的范围为【0,51);左闭右开
-- 3.2 第二块 开始节点为51
select  id  from test_table  where  id >= 51  limit  50, 1;  -- 算出第101个元素 如101;那第二块的范围为【51,101);左闭右开
-- 3.3 第三块类似,算出第三块的边界点为151.
select  id  from test_table  where  id>= 151 ;   -- 算出第四块的范围为 【151,+∞);左闭右开

使用:拿到每块的分块边界值。进行主键查找接口。

如第一块,已经有边界值为【0,51);

那么拼接的查询sql为 。需要的入参为表名,索引名,分区开始,分区结束

select  id  from test_table  where  id >= 0  and  id < 51  order  by  id
更多推荐

Git 的基本概念和使用方式

Git是一种分布式版本控制系统,它可以帮助开发者管理代码,跟踪代码的变化并协作开发。以下是Git的一些基本概念和使用方式:1.仓库(repository):存放代码的地方,包括本地仓库和远程仓库。2.分支(branch):用来指代不同代码的开发路径,可以独立开发、测试和合并。3.提交(commit):每次修改代码时,需

selenium自动化测试-登录网站用户

昨天学习了selenium自动化测试工具的入门,知道了Selenium是用于自动化控制浏览器做各种操作,打开网页,点击按钮,输入表单等等。今天学习通过selenium自动化测试工具自动登录某网站用户操作。第一步:确定目标网址比如:天天基金网站登录页面"https://login.1234567.com.cn/login

SpringBoot中pom.xml配置详解

🔔简介pom.xml是Maven项目的核心配置文件,用于管理项目的依赖、插件、构建配置等。在SpringBoot项目中,pom.xml文件也扮演着重要的角色。在pom.xml文件中,可以配置项目的资源文件。在SpringBoot的pom.xml文件中,通常会有一个标签文件,用于指定资源文件的路径和名称。🔔基本配置�

关于时空数据的培训 GAN:实用指南(第 01/3 部分)

第1部分:深入了解GAN训练中最臭名昭著的不稳定性。一、说明GAN是迄今为止最受欢迎的深度生成模型,主要是因为它们最近在图像生成任务上产生了令人难以置信的结果。然而,GAN并不容易训练,因为它们的基本设计引入了无数的不稳定性。如果你尝试过用MNIST以外的任何东西训练GAN,你很快就会意识到,所有关于训练他们的痛苦(以

【开发环境】安装 Hadoop 运行环境 ( 下载 Hadoop | 解压 Hadoop | 设置 Hadoop 环境变量 | 配置 Hadoop 环境脚本 | 安装 winutils )

文章目录一、下载Hadoop二、解压Hadoop三、设置Hadoop环境变量四、配置Hadoop环境脚本五、安装winutils六、重启电脑七、验证Hadoop安装效果一、下载HadoopHadoop发布版本在https://hadoop.apache.org/releases.html页面可下载;当前最新版本是3.3

Flutter插件之阿里百川

上一篇:Flutter插件的制作和发布,我们已经了解了如何制作一个通用的双端插件,本篇就带领大家将阿里百川双端sdk制作成一个flutter插件供项目调用!目录登录并打开控制台,创建应用:填写应用相关信息开通百川电商SDK申请安全图片下载SDK创建插件项目将ios端sdk下的framework和bundle文件夹复制到

WEB漏洞原理之---【XML&XXE利用检测绕过】

文章目录1、概述1.1、XML概念1.2、XML与HTML的主要差异1.3、XML代码示例2、靶场演示2.1、Pikachu靶场--XML数据传输测试玩法-1-读取文件玩法-2-内网探针或攻击内网应用(触发漏洞地址)玩法-3-RCE引入外部实体DTD无回显-读取文件开启phpstudy--apache日志3、XXE绕过

LwIP介绍

文章目录一、LwIP简介二、LwIP主要特性:三、文件说明lwip-2.1.3contrib-2.1.0一、LwIP简介lwIP(LightweightIP)是瑞典计算机科学院(SICS)的AdamDunkels开发的一个小型开源的TCP/IP协议栈。LwIP是LightWeight(轻型)IP协议,有无操作系统的支持

ArcGIS10.1软件安装教程

ArcGIS10.1中英文(32/64位)下载地址:链接:https://pan.baidu.com/s/1Ksm112WaKMMk6La9ircCng密码:t70f安装步骤:1、我们对安装包进行解压,直接鼠标右击解压即可。2、打开我们解压的文件夹,点击Desktop3、鼠标右击setup.exe图标,选择以管理员的身

9月20日,每日信息差

今天是2023年09月20日,以下是为您准备的12条信息差第一、法国欲推进欧盟境内航班最低限价,以期减轻民航业碳排放对气候变化的影响第二、2022年中国自主研发游戏海外市场销售收入超过173亿美元第三、京东发布三大生态升级举措。“流量生态”“运营生态”以及“成长生态”三大生态升级。据了解,京东将在直播、短视频、新品等方

PMP证书含金量怎么样?

对于职场打工人来说,拥有PMP®证书证明了自己擅长项目管理内容,直观增加在同事、雇主和猎头中的辨识度。目前国内一些领袖公司已经开始在企业内发起PMP®的认证,许多企业在项目管理岗位的招聘要求中也明确表示拥有PMP®证书者优先录取。PMP®证书不分行业,适合任何领域行业的项目。作为通用的项目管理理念,受到了当下不少企业的

热文推荐