PostgreSQL 禁用全表扫描的实现
PostgreSQL可以通过一些设置来禁用全表扫描(FULLSCAN/SeqScan)
注意:
设置此功能后不是完全避免全表扫描,而是只要有不通过全表扫描能得出结果的就不走全表扫描。
如果什么路都不通,那肯定得全表扫描,不然怎么获取数据。
而且并不是不走全表扫描性能就一定好。
下面展示下这个功能:
查询表结构:
highgo=#\dtest Tabletest Column|Type|Modifiers -------------+--------------------------------+----------- G|charactervarying(50)| A|charactervarying(12)| M|timestamp(0)withouttimezone| W|charactervarying(5)| Indexes: "s__x0"btree("G","A","M","W")
先检查视图:
highgo=#select*frompg_db_role_setting; setdatabase|setrole|setconfig -------------+---------+----------- (0rows)
查询执行计划:
highgo=#explainselect"G","Z"fromtestwhere"G"='PG'; QUERYPLAN ------------------------------------------------------------------------------ SeqScanontest(cost=0.00..3.11rows=1width=72) Filter:(("G")::text='7e'::text) (2rows)
对用户进行限制:
highgo=#alterrolexyhsetenable_seqscan=off; ALTERROLE highgo=#select*frompg_db_role_setting; setdatabase|setrole|setconfig -------------+---------+---------------------- 0|26171|{enable_seqscan=off}
再次查询执行计划:
highgo=#explainselect"G","Z"fromtestwhere"G"='7e'; QUERYPLAN ------------------------------------------------------------------------------ IndexScanusing"s__x0"ontest(cost=0.14..8.15rows=1width=72) IndexCond:(("G")::text='7e'::text) (2rows)
补充:psql会引起全表扫描的10种sql语句
1、模糊查询效率很低:
原因:like本身效率就比较低,应该尽量避免查询条件使用like;对于like‘%...%'(全模糊)这样的条件,是无法使用索引的,全表扫描自然效率很低;另外,由于匹配算法的关系,模糊查询的字段长度越大,模糊查询效率越低。
解决办法:首先尽量避免模糊查询,如果因为业务需要一定要使用模糊查询,则至少保证不要使用全模糊查询,对于右模糊查询,即like‘…%',是会使用索引的;左模糊like
‘%...'无法直接使用索引,但可以利用reverse+functionindex的形式,变化成like‘…%';全模糊是无法优化的,一定要的话考虑用搜索引擎。出于降低数据库服务器的负载考虑,尽可能地减少数据库模糊查询。
2、查询条件中含有isnull的select语句执行慢
原因:Oracle9i中,查询字段isnull时单索引失效,引起全表扫描。
解决方法:SQL语法中使用NULL会有很多麻烦,最好索引列都是NOTNULL的;对于isnull,可以建立组合索引,nvl(字段,0),对表和索引analyse后,isnull查询时可以重新启用索引查找,但是效率还不是值得肯定;isnotnull时永远不会使用索引。一般数据量大的表不要用isnull查询。
3、查询条件中使用了不等于操作符(<>、!=)的select语句执行慢
原因:SQL中,不等于操作符会限制索引,引起全表扫描,即使比较的字段上有索引
解决方法:通过把不等于操作符改成or,可以使用索引,避免全表扫描。例如,把column<>'aaa',改成column<'aaa'orcolumn>'aaa',就可以使用索引了。
4、使用组合索引
如果查询条件中没有前导列,那么索引不起作用,会引起全表扫描;但是从Oracle9i开始,引入了索引跳跃式扫描的特性,可以允许优化器使用组合索引,即便索引的前导列没有出现在WHERE子句中。
例如:
createindexskip1onemp5(job,empno);
全索引扫描
selectcount(*)fromemp5whereempno=7900;
索引跳跃式扫描
select/*+index(emp5skip1)*/count(*)fromemp5whereempno=7900;
前一种是全表扫描,后一种则会使用组合索引。
5、or语句使用不当会引起全表扫描
原因:where子句中比较的两个条件,一个有索引,一个没索引,使用or则会引起全表扫描。例如:whereA=:1orB=:2,A上有索引,B上没索引,则比较B=:2时会重新开始全表扫描。
6、组合索引
排序时应按照组合索引中各列的顺序进行排序,即使索引中只有一个列是要排序的,否则排序性能会比较差。
例如:
createindexskip1onemp5(job,empno,date); selectjob,empnofromemp5wherejob='manager'andempno='10'orderbyjob,empno,datedesc;
实际上只是查询出符合job='manager'andempno='10'条件的记录并按date降序排列,但是写成orderbydatedesc性能较差。
7、Update语句
如果只更改1、2个字段,不要Update全部字段,否则频繁调用会引起明显的性能消耗,同时带来大量日志。
8、对于多张大数据量
(这里几百条就算大了)的表JOIN,要先分页再JOIN,否则逻辑读会很高,性能很差。
9、selectcount(*)fromtable;
这样不带任何条件的count会引起全表扫描,并且没有任何业务意义,是一定要杜绝的。
10、sql的where条件要绑定变量
比如wherecolumn=:1,不要写成wherecolumn=‘aaa',这样会导致每次执行时都会重新分析,浪费CPU和内存资源。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持毛票票。如有错误或未考虑完全的地方,望不吝赐教。