MYSQL存储引擎基础知识介绍

2023-09-21 14:29:42

下面重点介绍几种常用的存储引擎,并对比各个存储引擎之间的区别,以帮助读者理解
不同存储引擎的使用方式。

在这里插入图片描述

MyISAM

  1. MyISAM是 MySQL的默认存储引擎。MyISAM不支持事务、也不支持外键,其优势是访
    问的速度快,对事务完整性没有要求或者以 SELECT、INSERT 为主的应用基本上都可以使用
    这个引擎来创建表。
  2. 每个 MyISAM在磁盘上存储成 3个文件,其文件名都和表名相同,但扩展名分别是:
    .frm(存储表定义);
    .MYD(MYData,存储数据);
    .MYI (MYIndex,存储索引)。
    数据文件和索引文件可以放置在不同的目录,平均分布 IO,获得更快的速度。
  3. 要指定索引文件和数据文件的路径,需要在创建表的时候通过 DATA DIRECTORY和 INDEX
    DIRECTORY语句指定,也就是说不同 MyISAM表的索引文件和数据文件可以放置到不同的路
    径下。文件路径需要是绝对路径,并且具有访问权限。
  4. 要指定索引文件和数据文件的路径,需要在创建表的时候通过 DATA DIRECTORY和 INDEX
    DIRECTORY语句指定,也就是说不同 MyISAM表的索引文件和数据文件可以放置到不同的路
    径下。文件路径需要是绝对路径,并且具有访问权限。
  5. MyISAM类型的表可能会损坏,原因可能是多种多样的,损坏后的表可能不能访问,会
    提示需要修复或者访问后返回错误的结果。MyISAM类型的表提供修复的工具,可以用 CHECK
    TABLE语句来检查 MyISAM表的健康,并用 REPAIR TABLE语句修复一个损坏的 MyISAM表。
    表损坏可能导致数据库异常重新启动,需要尽快修复并尽可能地确认损坏的原因。

InnoDB

  1. InnoDB存储引擎提供了具有提交、回滚和崩溃恢复能力的事务安全。但是对比 MyISAM
    的存储引擎,InnoDB写的处理效率差一些并且会占用更多的磁盘空间以保留数据和索引。
  2. 对于 InnoDB表,自动增长列必须是索引。如果是组合索引,也必须是组合索引的第一
    列,但是对于 MyISAM表,自动增长列可以是组合索引的其他列,这样插入记录后,自动增
    长列是按照组合索引的前面几列进行排序后递增的。
  3. 外键约束:MySQL 支持外键的存储引擎只有 InnoDB,在创建外键的时候,要求父表必须有对应的
    索引,子表在创建外键的时候也会自动创建对应的索引。
  4. 在创建索引的时候,可以指定在删除、更新父表时,对子表进行的相应操作,包 RESTRICT、
    CASCADE、SET NULL和 NO ACTION。其中 RESTRICT和 NO ACTION相同,是指限制在子表有
    关联记录的情况下父表不能更新;CASCADE表示父表在更新或者删除时,更新或者删除子表
    对应记录;SET NULL则表示父表在更新或者删除的时候,子表的对应字段被 SET NULL。选
    择后两种方式的时候要谨慎,可能会因为错误的操作导致数据的丢失。
  5. 当某个表被其他表创建了外键参照,那么该表的对应索引或者主键禁止被删除。
    在导入多个表的数据时,如果需要忽略表之前的导入顺序,可以暂时关闭外键的检查;
    同样,在执行 LOAD DATA和 ALTER TABLE操作的时候,可以通过暂时关闭外键约束来加快处
    理的速度,关闭的命令是“SET FOREIGN_KEY_CHECKS = 0;”,执行完成之后,通过执行“SET
    FOREIGN_KEY_CHECKS = 1;”语句改回原状态。
  6. 对于 InnoDB类型的表,外键的信息通过使用 show create table或者 show table status命
    令都可以显示。

MEMORY

  1. MEMORY存储引擎使用存在内存中的内容来创建表。每个 MEMORY表只实际对应一个
    磁盘文件,格式是.frm。MEMORY 类型的表访问非常得快,因为它的数据是放在内存中的,
    并且默认使用 HASH索引,但是一旦服务关闭,表中的数据就会丢失掉。
  2. 在启动 MySQL服务的时候使用–init-file选项,把 INSERT INTO … SELECT或 LOAD DATA
    INFILE这样的语句放入这个文件中,就可以在服务启动时从持久稳固的数据源装载表。
  3. 服务器需要足够内存来维持所有在同一时间使用的 MEMORY表,当不再需要 MEMORY
    表的内容之时,要释放被 MEMORY表使用的内存,应该执行 DELETE FROM或 TRUNCATE TABLE,或者整个地删除表(使用 DROP TABLE操作)。
  4. 每个 MEMORY表中可以放置的数据量的大小,受到 max_heap_table_size系统变量的约
    束,这个系统变量的初始值是 16MB,可以按照需要加大。此外,在定义 MEMORY表的时候,
    可以通过 MAX_ROWS子句指定表的最大行数。
    5.MEMORY 类型的存储引擎主要用在那些内容变化不频繁的代码表,或者作为统计操作
    的中间结果表,便于高效地对中间结果进行分析并得到最终的统计结果。对 MEMORY 存储
    引擎的表进行更新操作要谨慎,因为数据并没有实际写入到磁盘中,所以一定要对下次重新
    启动服务后如何获得这些修改后的数据有所考虑。

MERGE

  1. MERGE存储引擎是一组 MyISAM表的组合,这些 MyISAM表必须结构完全相同,MERGE
    表本身并没有数据,对 MERGE类型的表可以进行查询、更新、删除的操作,这些操作实际
    上是对内部的实际的 MyISAM 表进行的。对于 MERGE 类型表的插入操作,是通过
    INSERT_METHOD子句定义插入的表,可以有 3个不同的值,使用 FIRST或 LAST值使得插入
    操作被相应地作用在第一或最后一个表上,不定义这个子句或者定义为 NO,表示不能对这
    个 MERGE表执行插入操作。
  2. 可以对 MERGE表进行 DROP操作,这个操作只是删除 MERGE的定义,对内部的表没有
    任何的影响。
    MERGE表在磁盘上保留两个文件,文件名以表的名字开始,一个.frm文件存储表定义,
    另一个.MRG文件包含组合表的信息,包括 MERGE表由哪些表组成、插入新的数据时的依据。
    可以通过修改.MRG文件来修改 MERGE表,但是修改后要通过 FLUSH TABLES刷新。
  3. MERGE表并不能智能地将记录写到对应的表中,而分区
    表是可以的(分区功能在 5.1版中正式推出)。通常我们使用 MERGE表来透明地对多个表进
    行查询和更新操作,而对这种按照时间记录的操作日志表则可以透明地进行插入操作。

如何选择合适的存储引擎

在选择存储引擎时,应根据应用特点选择合适的存储引擎,对于复杂的应用系统可以根
据实际情况选择多种存储引擎进行组合。
下面是常用存储引擎的适用环境。
MyISAM:默认的 MySQL 插件式存储引擎。如果应用是以读操作和插入操作为主,
121
只有很少的更新和删除操作,并且对事务的完整性、并发性要求不是很高,那么选择这个存
储引擎是非常适合的。MyISAM是在 Web、数据仓储和其他应用环境下最常使用的存储引擎
之一。
InnoDB:用于事务处理应用程序,支持外键。如果应用对事务的完整性有比较高的
要求,在并发条件下要求数据的一致性,数据操作除了插入和查询以外,还包括很多的更新、
删除操作,那么 InnoDB存储引擎应该是比较合适的选择。InnoDB存储引擎除了有效地降低
由于删除和更新导致的锁定,还可以确保事务的完整提交( Commit)和回滚(Rollback),
对于类似计费系统或者财务系统等对数据准确性要求比较高的系统,InnoDB 都是合适的选
择。
MEMORY:将所有数据保存在 RAM中,在需要快速定位记录和其他类似数据的环境
下,可提供极快的访问。MEMORY 的缺陷是对表的大小有限制,太大的表无法 CACHE 在内
存中,其次是要确保表的数据可以恢复,数据库异常终止后表中的数据是可以恢复的。
MEMORY表通常用于更新不太频繁的小表,用以快速得到访问结果。
MERGE:用于将一系列等同的 MyISAM表以逻辑方式组合在一起,并作为一个对象
引用它们。MERGE 表的优点在于可以突破对单个 MyISAM 表大小的限制,并且通过将不同
的表分布在多个磁盘上,可以有效地改善 MERGE表的访问效率。这对于诸如数据仓储等 VLDB
环境十分适合。

更多推荐

kafka ack确认机制

Kafka使用ACK(Acknowledgment)确认机制来确保消息在生产者和消费者之间的可靠传递。这个机制确保消息在被认为已成功发送或处理之前不会被丢失。Kafka的ACK确认机制有三个级别:acks=0:这是最快速的确认级别,也是最不可靠的。生产者发送消息后不会等待任何确认,直接将消息添加到分区的副本中,并认为消

汽车电子系统总线LIN通信协议精要

汽车电子系统总线LIN通信协议精要文章目录汽车电子系统总线LIN通信协议精要简介LIN信号的物理层LIN总线收发器LIN通信协议LIN的主机和从机LIN报文帧结构同步间隔段(Breakfield)同步段(Syncfield)受保护的帧ID(ProtectedIdentifierfield)应答数据段(Datafield

从零开始:使用 Kubernetes 部署 Nginx 应用

[root@icv-k8s-node-1~]#kubectlcreatedeploymentjavaedge-nginx--image=nginx:1.24.0deployment.apps/javaedge-nginxcreated[root@icv-k8s-node-1~]#kubectlgetallNAMEREA

内网穿透的应用-NAS私有云存储 - 搭建Nextcloud私有云盘并公网远程访问

文章目录摘要1.环境搭建2.测试局域网访问3.内网穿透3.1ubuntu本地安装cpolar3.2创建隧道3.3测试公网访问4配置固定http公网地址4.1保留一个二级子域名4.1配置固定二级子域名4.3测试访问公网固定二级子域名摘要Nextcloud,它是ownCloud的一个分支,是一个文件共享服务器,允许您将个人

月木学途开发 5.轮播图模块

概述效果图数据库设计轮播图表DROPTABLEIFEXISTS`banner`;CREATETABLE`banner`(`bannerId`int(11)NOTNULLAUTO_INCREMENT,`bannerUrl`longtext,`bannerDesc`varchar(255)DEFAULTNULL,`bann

十天学完基础数据结构-第一天(绪论)

1.数据结构的研究内容数据结构的研究主要包括以下核心内容和目标:存储和组织数据:数据结构研究如何高效地存储和组织数据,以便于访问和操作。这包括了在内存或磁盘上的数据存储方式,如何将数据元素组织成有序或无序的集合,以及如何表示复杂的数据关系。数据的操作和处理:数据结构不仅关注数据的存储,还关注如何对数据进行各种操作,如插

并发编程——ScheduledThreadPoolExecutor

文章目录ScheduledThreadPoolExecutor介绍ScheduledFutureTask四种方法执行任务execute方法schedule方法scheduleAtFixedRate和scheduleWithFixedDelay分析ScheduledThreadPoolExecutor介绍Schedule

力扣刷题(简单篇):两数之和、两数相加、无重复字符的最长子串

坚持就是胜利一、两数之和题目链接:https://leetcode.cn/problems/two-sum/给定一个整数数组nums和一个整数目标值target,请你在该数组中找出和为目标值target的那两个整数,并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素在答案里不能重复出现。你

QCA组态如何科学命名?

前言(一)文献来源文献来源:[1]FurnariS,CrillyD,MisangyiVF,etal.Capturingcausalcomplexity:Heuristicsforconfigurationaltheorizing[J].AcademyofManagementReview,2021,46(4):778-7

Linux下的系统编程——线程同步(十三)

前言:在多线程编程中,如果多个线程同时访问和修改共享资源,可能会产生竞争条件和数据不一致的问题。同步机制用于协调线程之间的访问和操作,确保数据的正确性和一致性。为了避免多个线程同时访问和操作共享资源导致的问题,可以使用互斥锁(mutex)来实现线程的互斥访问。互斥锁可以保证同一时间只有一个线程访问共享资源、条件变量用于

读书笔记:多Transformer的双向编码器表示法(Bert)-2

多Transformer的双向编码器表示法BidirectionalEncoderRepresentationsfromTransformers,即Bert;第2章了解Bert模型(掩码语言模型构建和下句预测)文本嵌入模型Bert,在许多自然语言处理任务上表现优秀,本节主要包括:了解Bert,及与其他嵌入模型的区别;分

热文推荐