MySQL InnoDB存储引擎

MySQL InnoDB存储引擎

InnoDB 存储引擎的优点:由于 InnoDB 存储引擎存储的数据量大,性能高,可以有效的保证数据安全等优点,在 MySQL 5.5 后称为了默认的存储引擎。

InnoDB 内存结构: 缓冲池(buffer poll) 变更缓冲池(Change Buffer) 日志缓冲区(Log Buffer) 自适应哈希(Adaptive Hash Index)

缓冲池作用:内存中主要工作区域,优化查询性能 变更缓冲区作用:优化修改操作的性能 日志缓冲区作用: 自适应哈希作用:进一步提升查询的性能

磁盘结构中包括: 系统表空间: 独立表空间: 通用表空间: 临时表空间: 撤销表空间: 重做日志: 双写缓冲区:

以上这些都是保存的是真是的数据。

InnoDB 为什么要设计成内存和磁盘两个部分: 因为真实的数据需要保存在磁盘里, 但是磁盘的速度是比较慢的,而严重影响数据库整体的性能,而影响应用程序的性能,所以我们需要将常用的数据放在内存中,提示查询速率,但是内存中的数据是易失的,所以可以将常用的数据缓存在内存里,当第二次查询同样的数据,那么就可以将缓存的数据直接返回给客户端。所以磁盘是用来持久化的,而内存是用来缓存提高效率的。

使用 InnoDB 存储引擎创建的表对应的数据文件在哪里: 1.数据目录所在的路径 当创建一个数据库时,会在数据目录生成一格与数据库同名的子目录,数据库同名的子目录中保存的是表对应的数据文件

MySQL 存储结构: MySQL为了有效的维护数据而定义的一系列数据结构

什么是表空间文件: 表空间文件就是用来存储数据的文件,表空间文件的大小由存储的数据多少决定的,不同的表空间文件存储的种类也是有所不同的,在MySQL 中表空间分为五类,系统表空间,独立表空间,通用表空间,临时表空间,撤销表空间。

表空间和表空间文件的关系: 对于使用者而言,表空间,表空间文件,数据文件,是一个东西。而表空间就是设计层面上的,而表空间文件就是实际层面的,以文件的形式存在在次磁盘上面。

用户数据在表空间中是如何存储的: 想要搞清楚用户的数据在表空间中是如何存储的,实际上我们只需要知道 MySQL 的存储结构是如何定义的,其实这两个就是一个问题。 首先我们知道,用户的数据是以数据行的方式存储在对应的表空间文件中的,所以我们就需要对表空间文件中的数据行进行管理,而为了方便管理,表空间是由,段,区组,区,页,数据行,组成的,其中页是 InnoDB 中磁盘管理的最小单位。

为什么使用页这个数据管理单元: MySQL 是一个应用程序,它是运行在操作系统上的,而 MySQL 不论是数据的存储还是查询,实际上都是需要经过磁盘的,而磁盘作为硬件应用程序并不能直接访问,所以需要通过操作系统,而所以MySQL读取或者是写入都是需要经过操作系统的,但是操作系统一次性读取次磁盘都是最小4k,而MySQL为了一次性读取更多的数据,自己定义了一个数据结构页,一次是16k,而 MySQL 的在读取或者写入的时候大量的时间都是消耗在了磁盘的IO上,但是如果一次性读取16k的话,根据局部性原原理,大概率下一次访问的数据也在这一次读取的数据中,所以下一次就不需要继续访问磁盘了,这样也就提高了MySQL的整体性能。

局部性原理: 程序在执行的时候呈现的局部性规律,整个程序在执行的过程中,在一段时间内大概只执行该程序的的某一部分,而局部性原原理通常有两种形式:时间和空间局部性 时间局部性就是一个信息在被访问的时候,那么大概率在这段时间内会被一直访问。 空间局部性就是正在访问的数据可能就是下一次访问数据的地址空间是相近的。

页结构: MySQL 中有许多不同类型的页,但是每一种页都会包含页头页尾, 在页头,页尾之间的页主体信息根据不同的类型有不同的结构,最常见的就是用来存储数据和索引的“索引页”,也叫做 “数据页”,页的注意信息使用数据行进行填充。

查询的数据超过一页的大小,如何提高查询效率: 1.不同的页在磁盘中是不是连续的: 不一定,在不做任何控制的情况下,不同的页在磁盘中申请的地址大概率是不连续的。

2.为什么不连续的地址会降低查询的效率: 当存储的介质是机械硬盘时,访问不连续的地址会带来磁盘寻址的开销,也就是磁盘的随机访问。 因为在磁盘上,当我们需要访问一个数据的时候,需要先找到对应的磁道,然后在找到对应的扇区,最后才是读取数据,所以磁头的移动是很费时的。

3.如果页不是连续的,对访问效率是否有影响:

4.InnoDB 如何保证页在磁盘中的连续性: 为了解决磁盘的随机访问这个问题,所以需要尽可能的在磁道上读取连续的数据,介绍磁头的移动,MySQL 使用这个结构来管理页,规定每个区固定为1MB, 可以存放64个页,所以即使跨页读取数据,那么大概率也是在附件的地址。

我们知道 InnoDB 是使用区来组织页的,并且每一个区都是固定大小1MB,可以包括64个页,所以说查询的数据超过1页的时候会有下面的情况 页在区内,并且页相邻:这时候磁盘是顺序IO,大幅的提升磁盘的IO效率 页在区内,但不相邻:这时候可以大量的减少磁头的移动,可以提升效率 页在不同的区内:这种情况是不能提升效率的

区的特点:大小1MB

区和页的关系:区是管理页的,区中包含若干个页,保证区中页的连续性

当表中的数据很少的时候,如何避免空间浪费: 为什么表中数据很少的时候会存在空间的浪费?因为区的特点就是一次申请1MB,那么当新创建的表中,数据的大小不能确定,所以不一定这个表一定可以使用完1MB,所以就会存在空间的浪费。 那么MySQL为了解决这个问题,在刚开始创建的表中实际上只有7页,而不是申请一个完整的区。 刚开始的这些页会放在碎片区,当数据量达到32页的时候,后面的申请就会每次申请一个完整的区。 通过零散页和碎片区来避免空间浪费。

如果访问的数据跨区了,如何提高查询效率: 1.区的偏移量 2.区管理的数据的范围 3.用双向链表把区组织起来 对于区组也需要管理自身的属性 1.区组管理数据的范围 2.用双向链表把区组也组织起来 碎片区作为表空间中的第一个区组中的第一个区,而这个区的前四页,这个是比较特殊的: File Space Header:表空间和区组中的条目信息 Insert Buffer Bitmap: Change Buffer 的相关信息 File Segment inode: 段信息 B-tree Node:索引根信息 其他为空闲也用来保存真实的数据 使用区组结构有效的管理区,每个区组管理256个区也就是256MB, 区组条目的信息会记录在每个区的偏移并用双向链表链接。

上面的数据结构还有优化的空间吗: 上面说的区,区组和页都是物理结构,而在这些物理结构的基础上定义了一个逻辑结构,。 段可以区分不同功能的区在碎片中的页,并按功能分为叶子节点段和非叶子节点段,作为B+树索引中的叶子和非叶子节点。

上面所有的操作是在哪里进行的: 所有的数据库操作在内存中进行的,当数据处理完毕后又会刷新到磁盘中对应的页上。

查询数据时MySQL会一次性将表中的数据全部加载到内存中吗: 如果将一个表中的全部数据都加载到内存中的话,可能这个表的数据量是比较大的,内存是无法满足表中全部的数据的,所以不会吧表中的数据全部加载到内存中。

没查询一条数据都要进行一次IO吗: 前面我们说了当我们查询数据的时候,我们需要先看一下缓存里面有没有,当缓存里面没有的话才会进行磁盘IO,而每一次的磁盘IO也并不是只加载一条数据行,而是当找到对应的数据行的时候,会将该数据行所在的页全部加载到内存中,所以当我们每次进行查询一条数据的时候,并不一定会每次都进行IO,而且在MySQL中如果当一个区中的页经常被访问的时候,MySQL也会将区中的页加载到内存中,以便于访问。

页大小可以设置吗: 在MySQL中有一个系统变量 innodb_page_size 可以设置页大小,这里建议4kb 的整数倍。

在 MySQL 中有哪些页?我们重点关注哪些: 因为 MySQL 中有许多不同的数据需要存储,所以常见的就有,数据页Undo Log 页Change Buffer 页Extent Descriptor 页, 但是我们最关注的是数据页。在InnoDB 中也可以叫索引页。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/781061.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

暄桐教练日课·21天《线的初识》即将开始 一起感受线描的乐趣

林曦老师的直播课,是暄桐教室的必修课。而教练日课是丰富多彩的选修课,它会选出书法史/美术史上重要的、有营养的碑帖和画儿,与你一起,高效练习。而且暄桐教练日课远不止书法、国画,今后还会有更多有趣的课程陆续推出&…

Python | Leetcode Python题解之第214题最短回文串

题目: 题解: class Solution:def shortestPalindrome(self, s: str) -> str:n len(s)fail [-1] * nfor i in range(1, n):j fail[i - 1]while j ! -1 and s[j 1] ! s[i]:j fail[j]if s[j 1] s[i]:fail[i] j 1best -1for i in range(n - 1,…

Django之项目开发(二)

目录 一、安装和使用uWSGI 1.1、安装 1.2、配置文件 1.3、启动与停止uwsgi 二、安装nginx 三、Nginx 配置uWSGI 四、Nginx配置静态文件 五、Nginx配置负载均衡 一、安装和使用uWSGI uWSGI 是一个 Web 服务器,可以用来部署 Python Web 应用。它是一个高性能的通用的 We…

大模型备案全网最详细流程【附附件】

本文要点:大模型备案最详细说明,大模型备案条件有哪些,《算法安全自评估报告》模板,大模型算法备案,大模型上线备案,生成式人工智能(大语言模型)安全评估要点,网信办大模型备案。 大模型备案安…

Arduino ESP8266 开发环境搭建

Arduino ESP8266 开发环境搭建 很久之前学嵌入式时,用过Arduino8266进行开发,开发成本低、难度小,体验很不错。 近期,又突然要用,遂再次搭建环境,但变动挺多,有些小波折,开贴记录。…

unity强力配置插件Luban【Next最新版本】(二)本地化

文章目录 前言一、快速实现静态本地化1、表格格式2、本地化文本3、修改bat文件3、打表 二、多语言切换1、修改bat文件2、增加本地化管理脚本3、测试 总结 前言 无需多言,本地化(Localization,简称 L10N)是指将产品、内容或服务适…

注意力机制 attention Transformer 笔记

动手学深度学习 这里写自定义目录标题 注意力加性注意力缩放点积注意力多头注意力自注意力自注意力缩放点积注意力:案例Transformer 注意力 注意力汇聚的输出为值的加权和 查询的长度为q,键的长度为k,值的长度为v。 q ∈ 1 q , k ∈ 1 k …

零基础STM32单片机编程入门(七)定时器PWM波输出实战含源码视频

文章目录 一.概要二.PWM产生框架图三.CubeMX配置一个TIME输出1KHZ,占空比50%PWM波例程1.硬件准备2.创建工程3.测量波形结果 四.CubeMX工程源代码下载五.讲解视频链接地址六.小结 一.概要 脉冲宽度调制(PWM),是英文“Pulse Width Modulation”的缩写&…

CAN总线(下)

位时序 为了灵活调整每个采样点的位置,使采样点对齐数据位中心附近,CAN总线对每一个数据位的时长进行了更细的划分, 分为同步段(SS)、传播时间段(PTS)、相位缓冲段1(PBS1&#xff0…

扩散模型笔记

长参数“T”决定了生成全噪声图像所需的步长。在本文中,该参数被设置为1000,这可能显得很大。我们真的需要为数据集中的每个原始图像创建1000个噪声图像吗?马尔可夫链方面被证明有助于解决这个问题。由于我们只需要上一步的图像来预测下一步&#xff0c…

机器学习 | 随机梯度下降分类器

数据科学和机器学习工具包中用于各种分类任务的一个重要工具是随机梯度下降(SGD)分类器。通过探索其功能和在数据驱动决策中的关键作用,我们开始探索SGD分类器的复杂性。 SGD分类器是一种与SGD回归器有着密切联系的灵活分类技术。它的工作原…

最新性价比最高的SSL证书申请

申请SSL证书时,为了确保过程的顺利进行以及获得可靠的加密连接,有几个关键点需要注意。 申请新性价比最高SSL证书步骤 1、登录来此加密网站,输入域名,可以勾选泛域名和包含根域。 2、选择加密方式,一般选择默认就可以…

redhat7.x 升级openssh至openssh-9.8p1

1.环境准备: OS系统:redhat 7.4 2.备份配置文件: cp -rf /etc/ssh /etc/ssh.bak cp -rf /usr/bin/openssl /usr/bin/openssl.bak cp -rf /etc/pam.d /etc/pam.d.bak cp -rf /usr/lib/systemd/system /usr/lib/systemd/system.bak 3.安装…

【Java探索之旅】多态:重写、动静态绑定

文章目录 📑前言一、重写1.1 概念1.2 方法重写的规则1.3 重写和重载的区别1.4 重写的设计原则 二、动静态绑定2.1 静态绑定:2.2 动态绑定: 🌤️全篇总结 📑前言 在面向对象编程中,重写和动静态绑定是重要的…

5G频段简介

5G频段 5G网络一共有29个频段,主要被分为两个频谱范围,其中6GHz以下的频段共有26个(统称为Sub6GHz),毫米波频段有3个。目前国内主要使用的是Sub6GHz,包括n1/n3/n28/n41/n77/n78/n79共7个频段。具体介绍如下…

Ubuntu 22.04.4 LTS 安装配置 MySQL Community Server 8.0.37 LTS

1 安装mysql-server sudo apt update sudo apt-get install mysql-server 2 启动mysql服务 sudo systemctl restart mysql.service sudo systemctl enable mysql.service #查看服务 sudo systemctl status mysql.service 3 修改mysql root密码 #默认密码为空 sudo mysql …

C# 如何获取属性的displayName的3种方式

文章目录 1. 使用特性直接访问2. 使用GetCustomAttribute()方法通过反射获取3. 使用LINQ查询总结和比较 在C#中,获取属性的displayName可以通过多种方式实现,包括使用特性、反射和LINQ。下面我将分别展示每种方法,并提供具体的示例代码。 1.…

MySQL第三天作业

一、在数据库中创建一个表student,用于存储学生信息 CREATE TABLE student( id INT PRIMARY KEY, name VARCHAR(20) NOT NULL, grade FLOAT ); 1、向student表中添加一条新记录 记录中id字段的值为1,name字段的值为"monkey"…

哲讯SAP知识分享:SAP资产模块常用事务代码清单

在当今日益复杂的商业环境中,企业对于资产管理的需求日益增强。SAP作为全球领先的企业管理软件提供商,其资产模块(AM)以其高效、灵活的特性,为企业提供了全面的资产管理解决方案。本文将对SAP资产事务类型进行详细介绍…

阿贝云免费虚拟主机和免费云服务器评测

阿贝云是一家提供免费虚拟主机和免费云服务器的服务提供商,为用户提供高性能的云计算服务。阿贝云的免费虚拟主机拥有稳定的性能和强大的安全性,用户可以轻松搭建自己的网站并享受无限的流量和空间。免费云服务器则提供了更强大的计算能力和灵活的配置选…