PostgreSQL 禁用全表扫描的实现

2023-07-06 06:30:02 377

PostgreSQL可以通过一些设置来禁用全表扫描（FULLSCAN/SeqScan）

注意：

设置此功能后不是完全避免全表扫描，而是只要有不通过全表扫描能得出结果的就不走全表扫描。

如果什么路都不通，那肯定得全表扫描，不然怎么获取数据。

而且并不是不走全表扫描性能就一定好。

下面展示下这个功能：

查询表结构：

highgo=#\dtest
Tabletest
Column|Type|Modifiers
-------------+--------------------------------+-----------
G|charactervarying(50)|
A|charactervarying(12)|
M|timestamp(0)withouttimezone|
W|charactervarying(5)|
Indexes:
"s__x0"btree("G","A","M","W")

先检查视图：

highgo=#select*frompg_db_role_setting;
setdatabase|setrole|setconfig
-------------+---------+-----------
(0rows)

查询执行计划：

highgo=#explainselect"G","Z"fromtestwhere"G"='PG';
QUERYPLAN
------------------------------------------------------------------------------
SeqScanontest(cost=0.00..3.11rows=1width=72)
Filter:(("G")::text='7e'::text)
(2rows)

对用户进行限制：

highgo=#alterrolexyhsetenable_seqscan=off;
ALTERROLE

highgo=#select*frompg_db_role_setting;
setdatabase|setrole|setconfig
-------------+---------+----------------------
0|26171|{enable_seqscan=off}

再次查询执行计划：

highgo=#explainselect"G","Z"fromtestwhere"G"='7e';
QUERYPLAN
------------------------------------------------------------------------------
IndexScanusing"s__x0"ontest(cost=0.14..8.15rows=1width=72)
IndexCond:(("G")::text='7e'::text)
(2rows)

补充：psql会引起全表扫描的10种sql语句

1、模糊查询效率很低：

原因：like本身效率就比较低，应该尽量避免查询条件使用like；对于like‘%...%'（全模糊）这样的条件，是无法使用索引的，全表扫描自然效率很低；另外，由于匹配算法的关系，模糊查询的字段长度越大，模糊查询效率越低。

解决办法：首先尽量避免模糊查询，如果因为业务需要一定要使用模糊查询，则至少保证不要使用全模糊查询，对于右模糊查询，即like‘…%'，是会使用索引的；左模糊like

‘%...'无法直接使用索引，但可以利用reverse+functionindex的形式，变化成like‘…%'；全模糊是无法优化的，一定要的话考虑用搜索引擎。出于降低数据库服务器的负载考虑，尽可能地减少数据库模糊查询。

2、查询条件中含有isnull的select语句执行慢

原因：Oracle9i中，查询字段isnull时单索引失效，引起全表扫描。

解决方法：SQL语法中使用NULL会有很多麻烦，最好索引列都是NOTNULL的；对于isnull，可以建立组合索引，nvl(字段,0),对表和索引analyse后，isnull查询时可以重新启用索引查找,但是效率还不是值得肯定；isnotnull时永远不会使用索引。一般数据量大的表不要用isnull查询。

3、查询条件中使用了不等于操作符（<>、!=）的select语句执行慢

原因：SQL中，不等于操作符会限制索引，引起全表扫描，即使比较的字段上有索引

解决方法：通过把不等于操作符改成or，可以使用索引，避免全表扫描。例如，把column<>'aaa'，改成column<'aaa'orcolumn>'aaa'，就可以使用索引了。

4、使用组合索引

如果查询条件中没有前导列，那么索引不起作用，会引起全表扫描；但是从Oracle9i开始，引入了索引跳跃式扫描的特性，可以允许优化器使用组合索引，即便索引的前导列没有出现在WHERE子句中。

例如：

createindexskip1onemp5(job,empno);

全索引扫描

selectcount(*)fromemp5whereempno=7900;

索引跳跃式扫描

select/*+index(emp5skip1)*/count(*)fromemp5whereempno=7900;

前一种是全表扫描，后一种则会使用组合索引。

5、or语句使用不当会引起全表扫描

原因：where子句中比较的两个条件，一个有索引，一个没索引，使用or则会引起全表扫描。例如：whereA=：1orB=：2，A上有索引，B上没索引，则比较B=：2时会重新开始全表扫描。

6、组合索引

排序时应按照组合索引中各列的顺序进行排序，即使索引中只有一个列是要排序的，否则排序性能会比较差。

例如：

createindexskip1onemp5(job,empno，date);
selectjob，empnofromemp5wherejob='manager'andempno='10'orderbyjob,empno,datedesc;

实际上只是查询出符合job='manager'andempno='10'条件的记录并按date降序排列，但是写成orderbydatedesc性能较差。

7、Update语句

如果只更改1、2个字段，不要Update全部字段，否则频繁调用会引起明显的性能消耗，同时带来大量日志。

8、对于多张大数据量

（这里几百条就算大了）的表JOIN，要先分页再JOIN，否则逻辑读会很高，性能很差。

9、selectcount(*)fromtable；

这样不带任何条件的count会引起全表扫描，并且没有任何业务意义，是一定要杜绝的。

10、sql的where条件要绑定变量

比如wherecolumn=：1，不要写成wherecolumn=‘aaa'，这样会导致每次执行时都会重新分析，浪费CPU和内存资源。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持毛票票。如有错误或未考虑完全的地方，望不吝赐教。