mysql基础(1):一条sql查询语句是如何执行的?

mysql> select * from T where ID=10;

一条简单sql查询,知道这条sql的内部执行流程,出现问题时可以更快的定位问题



一:MySQL基本架构

阿群博客

    mysql分为server层和存储引擎层两部分


    1:server层

        连接器,查询缓存,分析器,优化器,执行器等,涵盖了mysql大多数核心服务功能,以及内置函数(日期,时间,数学,加密函数),所有跨存储引擎的功能都在这一层实现,比如存储过程,触发器,视图等。


    2:存储引擎层

        负责数据的存储和读取。其架构模式是插件式的,支持InnoDB、MyISAM、Memory等。


二:连接器

    连接器负责跟客户端建立连接、获取权限、维持和管理连接。


    1:连接器和客户端连接的过程

        a. 客户端输入命令进行连接:mysql  -h$ip  -P$port  -u$user  -p。

        b. 用户名或密码不对的时候,报Access denied for user,客户端程序结束执行。

        c. 用户名和密码验证通过,连接器到权限表查出你拥有的权限,进行判断权限操作。一个用户连接成功后,即使你对这个用户的权限进行修改,不会影响已存在连接的权限,只有新的连接才会使用新的权限设置。

        d. show precesslist  Command为sleep 是代表空闲状态(连接完成后没有后续动作)。

        e.如果客户端长时间没动作,连接器会自动断开, wait_timeout控制默认值是8小时。


    2: mysql的长连接和短连接

        a. 长连接:连接成功后,客户端持续有请求,则一直使用同一个连接。

        b. 短连接:每次执行完很少的几次查询就断开连接,下次查询再重新建立一个。


    3: 长连接和短连接的使用

        a. 建立连接过程比较复杂,尽量减少建立连接的动作,尽量使用长连接,全部使用长连接之后你会发现,mysql占用内存涨的特别快,长连接累计下来,会导致内存占用太大,被系统强行kill,导致mysql异常重启。

        b. 定期断开长连接,使用一段时间后,或者程序判断执行一个内存占用大的查询后,断开连接,之后要查询要重连。

        c. mysql5.7版本+,执行一个比较大的操作后,执行mysql_reset_connection重新初始化连接资源,这个过程不需要重连和重新做权限验证,会将连接恢复到刚刚创建完的状态。


三:查询缓存

    1: 查询缓存是什么?

        连接建立完成后,就可以执行SQL语句了,这时候先到查询缓存中,是key-value进行缓存,key是sql语句,value是sql语句执行的结果,如果key存在直接返回value给客户端,不执行后面的操作。如果key不存在,继续执行后面的操作阶段,执行结果会被存入插入缓存中。


    2: 为什么不建议使用查询缓存?

        a. 因为查询缓存利大于弊,查询缓存的失效非常频繁,只要有对一个表的更新,这个表上所有的查询缓存都会被清空。因此系统配置表适合做查询缓存

        b. 提供按需使用的方式,把query_cache_type设置为DEMAND,对于默认的sql语句不是使用查询缓存,对于需要使用查询缓存的语句:select SQL_CACHE * from T from where id=10。

        c. MySQL8.0 查询缓存整个模块删除掉了。


四:分析器(做什么?

    如果没有命中缓存,就要真正执行语句,首先mysql需要知道你要做什么,因此需要对SQL语句进行解析。


    1: 首先词法分析:

        a. 你输入的多个字符串和空格组成的sql语句,MySQL需要识别出里面的字符串分别是什么,代表什么

        b. 如把select这个关键字识别出来代表查询语句,把字符串T识别为表名,把字符串ID识别成列ID


    2: 然后语法分析:

        a. 根据词法分析的结果,语法分析器会根据语法规则,判断这个sql语句是否满足MySQL语法

        b. 语句不对会收到语法错误,一般语法错误会提示第一个出现错误的位置

        c. 表是否存在,列是否存在等


五:优化器(怎么做?

    经过了分析器,MySQL就知道你要做什么,在开始执行之前,还要经过优化器的处理。


    1: 优化器是具体做什么的?

        a. 表里有多个索引的时候,决定使用哪个索引

        b. 一个语句中有多表关联(join),决定各个表的连接顺序

        c. 执行方法的逻辑效果是一样的,但是执行效率会不同,优化器的作用就是决定使用哪一种方案


六:执行器(具体执行

    MySQL通过分析器知道了你要做什么,通过优化器知道你该怎么做,于是进入了执行阶段,开始执行语句


    1: 判断对执行表有没有查询的权限

        如果没有,返回没有权限错误,如果缓存命中,没有权限也会报权限错误


    2: 根据表的引擎去执行

        a. 调用InnoDB引擎接口读取这个表的第一行,判断这个ID值是不是10,如果不是则跳过,如果是则这行存到结果集中。

        b. 调用引擎接口取下一行,重复相同的判断逻辑,直到取到这个表的最后一行。

        c. 执行器将上述遍历过程中所有满足条件行做成的记录集作为结果集返回给客户端。

        d. 对于有索引的表,第一次调用的是 “取满足条件的第一行” 这个接口,之后循环取出 “满足条件的下一行”这个接口。


阿群博客
请先登录后发表评论
  • 最新评论
  • 总共0条评论