时间:2021-07-01 10:21:17 帮助过:2人阅读
Oracle 所谓的并行操作通过把一个任务分解成许多小的、独立的部分,使得原来只能由一 个进程完成的一个大任务变成了可以由多个进程同时完成的若干个小任务,这样就能充分利用 系统资源包括多 CPU、多 IO 通道。可以用一个现实生活中的例子来解释什么是并行处理:计 算一条街道上有多少辆汽车,如果让你一个人完成这个任务,那你就需要从街头走到街尾才能 数清楚有多少辆车。如果有两个人一起完成这个任务,那就可以一个人从街头走向街尾、另一 个人从街尾走向街头,如果两个人的能力一样,理论上只需要原来的一半时间就可以完成这个 任务。
注意:只有Oracle企业版才支持并行处理。
Oracle 的并行架构涉及进程、内存和参数,下面将分别详细介绍。
并行操作会用到两类进程,分别叫做 Slave Process 和 Query Coodinator。前者是由若干个 进程组成,这些进程的地位相同,每个进程都负责一部分工作或者一个工作单元。比如全表扫 描,每个 Slave Process负责扫描 Segment 的一部分,这样的一组进程也叫做一个 PS Set(Parallel Server Set)。
Query Coodinator进程通常是发出 SQL 语句的那个进程,这个进程负责把一个任务分解成 若干个任务片,并申请 PS Set,为每个 Slave Process 指定工作片段,并收集每个 Slave Process 返回的处理结果并汇总成最终的结果返回给用户。总的来说可以这样理解两种进程的角色, Slave Process是真正干活的进程,而 Query Coordinator进程只是指手画脚,负责协调,当然偶 尔也会干活。
在并行架构中,Query Coornidator进程会把整个工作会按照一定粒度(Granules)划分成若 干个单元,每个 Slave Process 会分配一个工作单元,Slave Process 完成分配给它的单元后,如 果还有剩余的工作单元,则继续分配下一个单元,直到所有单元都完成。 Query Coornidator进程划分工作单元的粒度有两种。
注意:对于工作单元的划分是在语句的执行期间进行的,而不是在Parsing阶段进行。
Oracle 数据库中与并行有关的参数有多个,并且随着版本的不同这些参数变化也很大,读 者可以用 SHOW PARAMETER 命令查看这些参数,比如,以下是 Oracle 10.2.0.1 中的查询结果:
SQL> show parameter parallel
NAME TYPE VALUE
fast_start_parallel_rollback string LOW
parallel_adaptive_multi_user boolean TRUE
parallel_automatic_tuning boolean FALSE
parallel_execution_message_size integer 2152
parallel_instance_group string
parallel_max_servers integer 160
parallel_min_percent integer 0
parallel_min_servers integer 0
parallel_server boolean FALSE
parallel_server_instances integer 1
parallel_threads_per_cpu integer 2
recovery_parallelism integer 0
以上这些参数是与并行功能直接相关的,除此之外还有许多参数会间接地影响并行能力, 下面就介绍一些最重要的参数。
Oracle 的并行处理是通过专门进程完成的,这些就是前面说过的 Slave Process。并行进程是在数据库范围共享使用的,数据库里所有的并行进程组成一个进程池(PX Server Pool),每 当需要并行操作时,就会从这个池中取得足够数量的并行进程,当操作执行结束后,还需要把 并行进程返回这个池中。PARALLE_MAX_SERVERS 参数就是控制数据库范围内并行进程的最 大数量。这也是一种自我保护机制,如果不控制并行进程的数量很容易消耗光系统资源。
参数的缺省值=CPU 数量×10。如果把这个参数设置成 0,就相当于在数据库范围内禁用了 并行。
PARALLEL_MIN_SERVERS 参数定义进程池中最少要保有的并行进程数量,在数据库启 动时,这些进程就要被启动,并且在数据库生命期内要一直保持运行状态,即使没有用到并行 操作。
如果需要的 Slave Process超过了这个数量,Oracle 就会动态地增加 Slave Process,这些动 态增加的 Slave Process 完成任务后会等待 5 分钟,这 5 分钟内如果没有新的任务分配,Oracle 就结束这些进程。
PARALLEL_MIN_SERVERS参数的缺省值是 0,因此在测试并行时可以观察到,当发出一 个SQL语句后,通常要经过一段时间后才能看到P00n进程生成。这时会话表现等待在“os thread startup”事件上的。如果把这个参数设置成非 0 值,数据库实例启动时就会同时启动若干并行 进程,就可以减少启动新的并行进程的延迟时间。
查看 PS Server 的使用情况:
SQL> select * from v$px_process_sysstat
where statistic like ‘Server%‘;
STATISTIC VALUE
------------------------------------------------------------ ----------
Servers In Use 0
Servers Available 20
Servers Started 1924
Servers Shutdown 1904
Servers Highwater 20
Servers Cleaned Up 0
Server Sessions 9488
并行操作中必须的进程间通信(包括 Slave Process 和 Query Coordinator 之间,以及 Producer/Consumer模式的 Slave Process 之间)都是通过 Table Queue 实现的,所谓 Table Queue 实际就是共享内存,这些内存可以在 SGA的 Large Pool 中,也可以在 SGA的 Shared Pool 中。 Oracle 推荐应该把它放在 Larege Pool 中,以避免造成 Shared Pool 碎片。
利用下面语句可以判断 Table Queue 是在哪个 Pool中分配的,可以通过以下语句查询:
SQL> select * from v$sgastat
2 where name =‘PX msg pool‘;
POOL NAME BYTES
------------ -------------------------- ----------
shared pool PX msg pool 774720
这个查询结果显示 Table Queue 是在 Shared Pool 中分配的,这是应该避免的情况。如果是 在 Large Pool 中分配,查询结果就如下所示:
POOL NAME BYTES
------------ -------------------------- ----------
large pool PX msg pool 1076024
对于 Oracle 10g,有两种途径把 Table Queue 放在 Large Pool 中:
每个 Table Queue 是由3个(在 RAC环境下是 4个)Buffer组成的,这个参数定义的就是 每个 Buffer的大小,单位是 Bytes,缺省值是 2152Bytes。缺省值在大多数场合下都显得偏小, 可以把它调整成 16KB、32KB、64KB 等。
在调整这个参数前,需要考虑对内存的消耗情况,可以使用下面的公式来估计:
memory≥ parallel_max_servers×parallel_max_servers×parallel_execution_message_size×3 or 4
其中PARALLEL_MAX_SERVERS×PARALLE_MAX_SERVERS代表Table Queue最多时的 数量,因为在 Producer/Consumer模式下,Slave Process 是配对分配的。
PARALLEL_AUTOMATIC_TUNNING参数如果设置成 TRUE,Oracle 会做两件事:首先是 调整若干 PARALLEL参数值;其次,就是把 Table Qieue 放在 Large Pool 中。虽然在Oracle 10g中,这已经是一个废弃的参数了。不过仍然可以利用这个参数的后一种功能,达到强迫Oracle 把 Table Queue 放在 Large Pool 中的效果。
并行处理功能是一个性能加速器,但如果使用不当,又会成为性能杀手。这一点也很好理 解,如果所有的操作都使用并行处理,很快系统资源就会被消耗尽。比如表 A 的并行度是 4,那么所有这对这个表的访问都会使用 4 个 Slave Process,如果 PARALLEL_MAX_SERVERS 是 40,只要有10 个用户就可以耗尽整个 PX Pool。不仅如此,大量的并行进程会长时间占用 CPU、 磁盘资源,使得其他用户的操作根本没有执行的机会。因此需要对并行处理作控制。Oracle 10g 有两个参数可以调节并行,这个参数就是其中之一。
Oracle 并行操作
标签: