复盘eygle在甲骨文大会上演讲中的示例,看看什么是大师的由点及

盖总(eygle)在刚结束的甲骨文大会的演讲中,通过一个简单的UPDATE语句,为我们展示了什么叫由点及面的优化,什么叫由点及面的知识覆盖度,不在于这个案具体如何操作,更应关注或更值得我们借鉴的是这种学习态度和方法思路,大师是如何炼成的?我想这个案例可以带给我们一些启迪。

下面就复盘一下这个案例的整个过程,注:版权归盖总(eygle)所有~

问题描述:

问题的标题是:“并行更新成为系统瓶颈”

SQL:

UPDATE /*+ parallel(a, 8) */ tbl_a aSET name = (SELECT name FROM tbl_b WHERE id = a.id),class = (SELECT class FROM tbl_b WHERE id = a.id)WHERE a.id IN (SELECT /*+ parallel(b, 8) */ id FROM tbl_b b);

现象是这条SQL执行时间非常长,从介绍看是有2.5分钟。

优化过程:

1. 为了以下可以更清楚地说明问题,对这个SQL做了简化处理,我们需要优化的是这条SQL:

UPDATE tbl_a aSET name = (SELECT name FROM tbl_b WHERE id = a.id),class = (SELECT class FROM tbl_b WHERE id = a.id)WHERE a.id IN (SELECT id FROM tbl_b b);

我们创建两张模拟表:

SQL> create table tbl_a(id number,name varchar2(5),class varchar2(5));Table created.SQL> create table tbl_b(id number,name varchar2(5),class varchar2(5));Table created.SQL> create sequence seq_a cache 1000;Sequence created.SQL> create sequence seq_b cache 1000;Sequence created.

插入一些随机数据:

begin for i in 1 .. 100000 loopinsert into tbl_a values (seq_a.nextval, dbms_random.string(‘U’, 5), dbms_random.string(‘U’, 5)); end loop; commit;end;/PL/SQL procedure successfully completed.SQL> select count(*) from tbl_a; COUNT(*)————100000begin for i in 1 .. 10000 loopinsert into tbl_b values (seq_b.nextval, dbms_random.string(‘U’, 5), dbms_random.string(‘U’, 5)); end loop; commit;end;/PL/SQL procedure successfully completed.SQL> select count(*) from tbl_b; COUNT(*)————10000

2. 执行原SQL语句

SQL> set timing onSQL> UPDATE tbl_a aSET name = (SELECT name FROM tbl_b WHERE id = a.id),class = (SELECT class FROM tbl_b WHERE id = a.id)WHERE a.id IN (SELECT id FROM tbl_b b);10000 rows updated.Elapsed: 00:00:07.42

需要7秒多的时间(虽然和示例中2.5分钟有差距,但仅为了说明优化的问题,时间上的差距可以忽略)。

3. 第一次优化

我们从这个SQL中可以看到,更新TBL_A表的ID列,但TBL_B表的SELECT有三次,即三次的全表扫描,那么要是能减少TBL_B表检索的次数,执行时间肯定可以减少。

SQL> UPDATE tbl_a aSET (name, class) = (SELECT name, class FROM tbl_b WHERE id = a.id)WHERE a.id IN (SELECT id FROM tbl_b b);10000 rows updated.Elapsed: 00:00:04.04

这样的调整是符合SQL语法的,执行时间变为了4秒多,效果显著。

4. 第二次优化

虽然执行时间减少了接近一半,但SQL中还是对TBL_B执行了两次扫描,是否还可以减少一次?

SQL> UPDATE (SELECT b.name b_name, b.class b_class, a.name, a.classFROM tbl_a a, tbl_b bWHERE a.id = b.id)SET name = b_name, class = b_class;SET name = b_name, class = b_class*ERROR at line 4:ORA-01779: cannot modify a column which maps to a non key-preserved tableElapsed: 00:00:00.01

“造成这个错误的原因是更新的列不是事实表的列,而是维度表的列。换句话说,如果两张表关联,其中一张表的关联列是主键,那么另一张表就是事实表,也就是说另一张表中的列就是可更新的;除非另一张表的关联列也是主键,否则这张表就是不可更新的,如果更新语句涉及到了这张表,就会出现ORA-1799错误。如果是两张表主键关联,那么无论更新那个表的字段都可以。

其实这个限制的真正原因是Oracle要确保连接后更新的内容可以写到一张表中,而这就要求连接方式必须是1对N或者1对1的连接。这样才能确保连接后的结果集数量和事实表一致。从而使得Oracle对连接后子查询的更新可以顺利的更新到事实表中。”

a.id=b.id,我们是用TBL_B的id列作为条件更新,需要确保这列只会对应到TBL_B表的一行记录,可以为表TBL_B的id列设置主键、唯一索引或唯一约束,三种操作,这里选择设置唯一约束:

SQL> alter table tbl_b add constraint uq_b_id unique(id);Table altered.

再次执行:

SQL> UPDATE (SELECT b.name b_name, b.class b_class, a.name, a.classFROM tbl_a a, tbl_b bWHERE a.id = b.id)SET name = b_name, class = b_class;10000 rows updated.Elapsed: 00:00:00.12

执行时间一下仅为0.12秒。

上面如果TBL_A的ID列设置为主键,则为1对1的连接,如果仅是TBL_B的ID列为唯一约束,则为1对N的连接。

总结:

通过两次优化,执行时间从7秒降到了0.12秒,虽然这里的示例数据未必和实际情况一致,但成比例的缩放足以说明这个问题,从这个案例可以看出,优化的本质就是少做事,原始SQL执行三次全表扫描,那目标就是减少全表扫描的次数,第一次优化的操作可能相对容易想到,但第二次优化的操作,就需要知道可以有这种语法,而且出现了ORA-01799的错误,还需要知道这种错误的根本原因是什么,才能有可行的解决方法。

问题还没完,以上说明了SQL语句的优化,下面就是针对这条SQL展开的知识。

假设上面的TBL_A和TBL_B表是属于用户bisal的,此时新建一个用户phibisal,并授予最简单的权限:

SQL> create user phibisal identified by phibisal;User created.SQL> grant create session to phibisal;Grant succeeded.一个人行走,若是寂寞了,寻一座霓虹灯迷离闪烁,

复盘eygle在甲骨文大会上演讲中的示例,看看什么是大师的由点及

相关文章:

  • 【算法】直接插入排序C语言实现
  • 你感兴趣的文章:

    标签云:

    亚洲高清电影在线, 免费高清电影, 八戒影院夜间, 八戒电影最新大片, 出轨在线电影, 午夜电影院, 在线影院a1166, 在线电影院, 在线观看美剧下载, 日本爱情电影, 日韩高清电影在线, 电影天堂网, 直播盒子app, 聚合直播, 高清美剧, 高清美剧在线观看 EhViewer-E站, E站, E站绿色版, qqmulu.com, qq目录网, qq网站目录,