MySQL中如何识别低效的索引

2023-09-17 19:23:00

前言(可以跳过直接看正文)

索引的基本原理

索引用来快速地寻找那些具有特定值的记录。如果没有索引,一般来说执行查询时遍历整张表。
索引的原理很简单,就是把无序的数据变成有序的。读取数据时,先拿到倒排表内容,再取出数据地址链,从而拿到具体数据。如下图,MySQL索引默认结构为:
在这里插入图片描述
MySQL索引改良后的结构为:
在这里插入图片描述

索引设计的原则

  1. 适合索引的列是出现在where子句中的列,或者连接子句中指定的列
  2. 基数较小的类,索引效果较差,没有必要在此列建立索引
  3. 使用短索引,如果对长字符串列进行索引,应该指定一个前缀长度,这样能够节省大量索引空间
  4. 不要过度索引,索引需要额外的磁盘空间,并降低写操作的性能。在修改表内容的时候,索引会进行更新甚至重构,索引列越多,这个时间就会越长。所以只保持需要的索引有利于查询即可

创建索引的原则

索引虽好,但也不是无限制的使用,最好符合一下几个原则:

  1. 最左前缀匹配原则
  2. 较频繁作为查询条件的字段才去创建索引,更新频繁字段不适合创建索引
  3. 若是不能有效区分数据的列不适合做索引列,如性别,男女未知,最多也就三种,区分度实在太低,尽量的扩展索引,不要新建索引
  4. 定义有外键的数据列一定要建立索引
  5. 对于那些查询中很少涉及的列
  6. 对于定义为text、image和bit的数据类型的列不要建立索引

正文

使用索引查询一定能提高查询的性能吗?

通常,通过索引查询数据比全表扫描要快。合理的索引设计,可以大大减少慢SQL,但是我们也必须注意到它的代价。

索引需要空间来存储,也需要定期维护, 每当有记录在表中增减或索引列被修改时,索引本身也会被修改。 这意味着每条记录的INSERT,DELETE,UPDATE将为此多付出4,5 次的磁盘I/O。 因为索引需要额外的存储空间和处理,那些不必要的索引反而会使查询反应时间变慢。使用索引查询不一定能提高查询性能,索引范围查询(INDEX RANGE SCAN)适用于两种情况:

  • 基于一个范围的检索,一般查询返回结果集小于表中记录数的30%
  • 基于非唯一性索引的检索

怎样查看索引是否有高选择性?

通过Show Index结果中的列Cardinality来观察。非常关键,表示所以中不重复记录的预估值,需要注意的是Cardinality是一个预估值,而不是一个准确值基本上用户也不可能得到一个准确的值,在实际应用中,Cardinality/n_row_in_table应尽可能的接近1,如果非常小,那用户需要考虑是否还有必要创建这个索引。

在InnoDB存储引擎中,Cardinality统计信息的更新发生在两个操作中:insert和update。InnoDB存储引擎内部对更新Cardinality信息的策略为:

表中1/16的数据已发生了改变
stat_modified_counter>2000 000 000

用一条SQL查看低效的索引

根据Cardinality/n_row_in_table的大小,我们可以通过以下SQL查找某个schema(或者整个数据库实例)中,低效的索引,如下:

SELECT TABLE_SCHEMA, 
       TABLE_NAME, 
       INDEX_NAME,
       COLUMN_NAME,
       CARDINALITY,
       TABLE_ROWS, 
       index_rate   
FROM (SELECT a. TABLE_SCHEMA,
                a.TABLE_NAME,
                a.INDEX_NAME,
                a.COLUMN_NAME,
                a.CARDINALITY,
                b.TABLE_ROWS, 
               LEFT(IF(b. TABLE_ROWS = 0 || b. TABLE_ROWS IS NULL,
               0.00,a.CARDINALITY/b.TABLE_ROWS),4) AS index_rate
           FROM (SELECT TABLE_SCHEMA, 
                       TABLE_NAME,
                       INDEX_NAME,
                       COLUMN_NAME,
                       CARDINALITY
                   FROM information_schema.STATISTICS
                  WHERE TABLE_SCHEMA='xxxx'  -- xxxx为schema的名字
                  GROUP BY TABLE_SCHEMA, TABLE_NAME, INDEX_NAME) AS a JOIN information_schema.TABLES AS b
             ON a.TABLE_SCHEMA = b.TABLE_SCHEMA
             AND a.TABLE_NAME = b.TABLE_NAME
            and table_rows > 100000) c
                    where CARDINALITY < 100
  order by 5 asc,6 desc
  limit 10;

在这里插入图片描述

说明:低效的索引虽然大多时候不会被SQL执行计划选中,但是,不仅仅占用宝贵数据库空间,而且在INSERT,DELETE,UPDATE时需要对索引进行维护,降低性能,所以,低效的索引必须清理掉。

更多推荐

滚雪球学Java(28):轻松掌握数组:访问和遍历技巧

🏆本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,助你一臂之力,带你早日登顶🚀,欢迎大家关注&&收藏!持续更新中,up!up!up!!前言在Java编程中,数组是一种常用的数据结构。它在存储和处理数据时具有很高的效率,能够方便地进行访问和遍历。本文将介绍数组的访问和遍历技巧,帮助读者更加深入地了解Java数

单片机C语言实例:23、串口通讯

一、轮询发送程序实例1:#include<reg52.h>//包含头文件,一般情况不需要改动,头文件包含特殊功能寄存器的定义#include"delay.h"/*------------------------------------------------函数声明---------------------------

Vue记录(下篇)

Vuexgetters配置项*Count.vue<template><div><h1>当前求和为:{{$store.state.sum}}</h1><h3>当前求和的10倍为:{{$store.getters.bigSum}}</h3><selectv-model.number="n"><optionvalue="1"

vue+springboot,easyexcel的excel文件下载

文章目录1.效果展示1.1前端界面1.2下载的excel2.思路介绍3.前端代码展示4.后端代码展示5.核心代码解释1.效果展示excel文件单一sheet,多sheet导出本文主要介绍如何使用easyexcel,配合前端导出Excel文件。同时提供Excel的两种导出形式:单一sheet,多sheet。1.1前端界面

02-HTML常用标签

02-HTML常用标签2.1标签的构成标签由<、>、/、英文单词或字母组成。并且把标签中<>包括起来的英文单词或字母称为标签名常见标签由两部分组成,我们称之为:双标签。前部分叫开始标签,后部分叫结束标签,两部分之间包裹内容就是标签名。少数标签由一部分组成,我们称之为:单标签。自成一体,无法包裹内容(比如:<hr>、<b

Git 基本操作【本地仓库与远程仓库的推送、克隆和拉取】

文章目录一、Git简介二、Git的下载安装三、Git常规命令四、新建本地仓库五、本地分支操作六、Git远程仓库七、远程仓库克隆、抓取和拉取八、总结九、学习交流一、Git简介Git是分布式版本控制系统(DistributedVersionControlSystem,简称DVCS),分为两种类型的仓库:本地仓库和远程仓库工

51单片机1【单片机到底是什么】

1.从电路到集成电路1.电路发展变化的趋势(1)功率:电子设备·越来越省电,待机时间越来越长,工作电压越来越低。(2)体积:体积越来越小(3)功能:功能越来越强大2.微器件(1)电路的核心:开关控制,倍率控制(2)电子管,晶体管3.集成电路(IC,芯片)的出现(1)IC(integratedcircuit,集成电路),

[创业之路-76] - 创业公司如何在长期坚持中顺势而为?诚迈科技参观交流有感

目录一、创业环境1.1.VUCA乌卡时代:易变、复杂、不确定性、模糊的时代1.2.中国用了四十年的时间完成了三次工业革命:机械化、电气化、数字化1.3.中国正在经历着第四次工业革命:智能化、生态化、拟人化1.4国产替代:国产化1.5所有的赛道都挤满了人二、创业公司在长期坚持中顺势而为的路径2.1做自己的熟悉行业:对行业

annyang语音识别与语音合成库

*text是Annyang.js中的一个通配符,表示匹配任何语音输入中的文本,并将其作为参数传递给命令回调函数。例如,如果用户说“searchforcats”,则可以使用以下命令来捕获输入中的搜索词:constcommands={'searchfor*text':(text)=>{console.log('Search

Selenium和Requests搭配使用

Selenium和Requests搭配使用前要1.CDP2.通过requests控制浏览器2.1代码一2.2代码23.通过selenium获取cookie,requests携带cookie请求前要之前有提过,用selenium控制本地浏览器,提高拟人化,但是效率比较低,今天说一种selenium和requests搭配使

人类的生成式与机器的生成式

生成式是指一种基于模型的方法,通过给定的条件或输入,生成与之相符合的输出。在自然语言处理领域中,生成式模型通常用于生成文本、文章、对话等自然语言序列。生成式模型的训练主要涉及两个步骤:学习和生成。在学习阶段,模型通过对大量的训练数据进行学习和训练,以学习出模式、语法和语义等语言特征。在生成阶段,模型接受一个初始输入,并

热文推荐