在数据库中,用户可能多次执行相同的查询语句。为了提高查询效率,数据库会在内存在划分一个专门的区域,用来存放用户最近执行的查询,这块区域就是缓存。因为内存的运行速度要比硬盘快的多。为此通过缓存机制,就可以提高查询的效率。当用户下一次再执行相同查询时,就可以直接从缓存中获取数据,而不用到硬盘中的数据文件中去读取数据,也可以省去相关解析的工作。
一、数据缓存的应用环境
并不是在任何情况下数据缓存都能够起到应有的效果。如果企业有一个不经常改变的表并且服务器受到这个表的大量的相同查询时,数据缓存才能够起到不错的效果。通常情况下,针对Web的应用,效果会比较明显。如现在在数据库中有一张产品信息表。企业的用户需要通过网页来查询产品的信息。如果在系统设计时,默认查询的结果是显示最近一个月交易过的产品信息。那么每次用户按默认情况查询产品信息时,将都会从缓存中获取信息(如果相关的信息没有被更新过)。此时系统查询的速度就会比较快。
如果企业有一个不经常改变的表并且服务器受到这个表的大量的相同查询时,笔者就建议大家启用数据缓存机制。在启动之前,可以先使用命名(如上图所示)来查询现在系统缓存是否开启。如上图所示,如果查询的结果是YES的话,那么就说明系统中已经开启了数据缓存机制。
二、数据缓存使用的限制
并不是在任何情况下,数据缓存都会起到改善查询的效果。根据笔者的项目经验,认为在一下几种情况,数据缓存机制的效果并不会很大。
一是查询所涉及到的表会经常更改。如在一个进销存管理系统中,可能会有产品与销售记录两张表格。产品表一般不怎么会更新,而销售记录表就可能每分钟都会发生变化。此时对于销售记录表来说,采用缓存机制就不会起到多大的效果。因为根据缓存的工作原理,当某个表被更改后,其对应的数据缓存的相关条目就会被清空。
二是查询缓存不使用与服务器方便些的语句。根据B/S或者C/S架构,可以将相关应用分为服务器断和客户端两类。在使用数据缓存时,数据库管理员要考虑到,在MySQL数据库中,查询缓存并不适用于服务器方所编写的查询语句。当数据库管理员正在使用服务器方编写的语句时,要注意到这些语句并不会应用缓存技术。
三是查询时使用缓存的两个基本条件:所采用的查询语句完全一样以及相关数据表妹欧发生更改。对于后面一条,上面已经谈到过。这里笔者要说的是,什么叫做查询语句瓦圈一样?简单的说,就是前后使用的两条查询语句(不一定要连在一起)完全一致。不仅包括查询的字段,也包括查询的条件。在这里要认识到一个误区。如果在5分钟之前用户查询一个产品信息表,其没有用到任何查询条件,查询全部的产品信息记录。5分钟之后又有一个用户查询产品信息表,此时其使用了查询条件,如只查询最近一个月新建的产品信息。显然此时后面一个查询的结果是前面一个查询结果的子集(不考虑产品基本表在这个时间间隔中是否做了更改)。照理来说应该可以使用数据缓存。但是这里需要注意,此时前后两条查询语句,其是不相同的(其查询条件不同)。即使结果是相同的,或者具有包含关系,数据库仍然会先重新解析SQL语句,然后从硬盘上的数据文件中去获取数据。
另外需要注意的是如果用户在查询语句中,使用了自定义函数、自定义变量或者因引用了系统数据库中的表,那么缓存机制也会失效。
三、提高缓存的使用效果
通过数据库的合理设计,可以提高缓存的使用效果,扩大缓存的使用领域。具体的说,数据库管理员可以从如下几个方面出发。
1、 根据数据变化的频率来分解表
如现在有产品基本资料与产品最新库存两部分内容。在不考虑缓存的情况下,可以将产品基本资料与产品库存放在同一个表中,然后通过其他作业来更新这个库存数量。如此的话,在前台界面中,就可以直观的反映出产品的库存数量。但是从缓存的设计角度来看,这么操作并不是很合理。因为产品信息相对来说不怎么会变化,而库存数量却经常在发生变化。如果将他们放在同一张表上,由于库存数量的不断更新,数据缓存中的内容就会不断被清空(与产品信息表相关的数据缓存)。此时如果很多用户要查询产品的描述、规格(他们可能并不关注产品的库存),那么他们就无法使用数据缓存。因为缓存中没有相关的数据(由于库存数量不断变化而被清空)。
遇到这种情况时,数据库管理员就可以将库存数量与产品基本信息存放在两张不同的表上,然后通过关键字来进行关联。这么做的好处就是库存数量更新并不会影响到产品基本信息表所对应的数据缓存(他们是两张表)。从而提高产品信息查询时的缓存命中率。
2、 采用默认条件的查询来提高缓存命中率
在上面的分析中笔者谈到,要两条完全相同的SQL语句才能够使用缓存。条件不同或者使用的字段不同,数据库系统都不会使用缓存来进行查询优化。另外MySQL数据库与其他数据库不一样,对于SQL语句解析来说,其大小写实敏感的。也就是说同一条查询语句,如果其关键字的大小写不同,那么也会被认为是用了不同的SQL语句。这一点是比较让人头疼的。针对这种情况,在客户端应用程序设计时,最好注意以下几点。
一是要习惯采用默认条件的查询来提高缓存命中率。如在设计产品信息查询这个功能,可以考虑默认查询全部信息或者指定某个固定的条件。如此就可以提高缓存的命中率。而不要在不同的用户界面设置不同的默认值。某些应用系统,为了提高界面的友好性,会给用户提供一些个性化设置的参数,以保存用户的个性化内容。此时虽然可以提高界面的人性化,但是显然会降低数据缓存的命中率。遇到这种情况时,数据库管理员就需要在人性化设计与系统的查询性能之间进行均衡。
不同的应用针对同一个表格的相同查询,其查询语句最好相同。如现在对于产品信息,即可以通过产品信息窗口进行查询,也可以根据报表来查询。此时其对应的后台表格是相同的。只要其执行的查询语句相同、并且在这段时间之内数据库表格没有发生变化,那么系统就可以从缓存中获取数据。在实际工作中,窗体与报表往往是有不同的人设计与开发的。如果现在这两个人SQL语句的书写习惯不同,一个人喜欢用大写,而另外一个人喜欢用小写。在系统中,对于SQL查询语句解析时区分大小写。如果大小写不同,则会被认为不同的SQL语句,此时系统也就无法使用缓存了。为此在遇到这种情况时,不同的用户之间要统一SQL语句的书写规范,如要么全部使用大写,要么全部使用小写。项目管理员要根据实际情况来制定相关的规则。
3、 提高缓存空间大小来提高数据库的缓存命中率
当数据缓存满时,新的数据会覆盖旧的数据。如现在用户查询了一笔产品信息。1个小时后其在利用相同的语句查询了这个产品信息(假设在这个过程中产品信息表没有发生变化)。查询语句是否会采用缓存呢?答案是不一定。如果企业服务器的缓存空间足够的大,旧的缓存信息没有被新的查询内容所覆盖,那么就会采用缓存中的信息。相反,如果缓存比较小,此时系统旧的缓存信息就会被新的查询内容所覆盖掉。在这种情况下,即使查询的语句相同、表格也没有发生变化,数据库系统仍然要从硬盘上的数据文件中去获取数据。
为此为了提高查询的效率,提高缓存的命中率,最好能够增加服务器上缓存的空间。现在内存价格比较便宜,这笔投资应该不会太大。特别是当在一台服务器上实现不同的应用时,提高内存的容量还是蛮有必要的。
|