集群系统进程和服务总览

2018-01-11 Oracle 宅必备

Oracle版本:11.2.0.4

上节介绍的是Oracle 集群所需的软硬件需求

http://www.zhaibibei.cn/cluster/1.1/

这节介绍运行集群环境所需的进程


1. Oracle集群Stack

Oracle集群包含两个独立的Stack

上层的Stack由Cluster Ready Services (CRS) 守护进程 (crsd)管理

下层的Stack由Oracle High Availability Services daemon (ohasd)管理

1. 1 Oracle High Availability Services Stack

如下为和ohas相关的进程

Cluster Logger Service (ologgerd):

该服务收集集群中所有节点的信息并将其保存在一个chm 库里,该只会运行在集群的其中2个节点中

System Monitor Service (osysmond)

该负责服务监控和操作operating system metric collection 服务,该服务发送数据到Cluster Logger Service 该服务运行在集群中的每个节点上

Grid Plug and Play (GPNPD)

该服务提供对Grid Plug and Play profile的访问,确保所有节点用用最近的profile

Grid Interprocess Communication (GIPC)

一个support守护进程启用Redundant Interconnect Usage

Multicast Domain Name Service (mDNS)

Grid Plug and Play使用该服务来定位集群中的profile,也被GNS用来提供解析域名解析 该进程为后台进程

Oracle Grid Naming Service (GNS)

该服务负责处理外部DNS服务器的请求,解析集群中定义的域名

1.2 The Cluster Ready Services Stack

如下为和crs相关的进程

Cluster Ready Services (CRS):

这个是管理集群高可用的主程序

crsd守护进程负责管理OCR中定义的各个资源,包括start, stop, monitor, and failover 等动作

crsd在资源发生改变时会生成该事件(event)

如果安装了RAC,crsd还负责监控数据库进程,监听等,并在其失败时启动它

Cluster Synchronization Services (CSS):

该服务控制哪个节点属于集群中的成员,并在节点新增或退出集群时通知其他成员

如果使用第三方集群软件,则css进程负责和其进行通信

cssdagent 进程监控集群并提供 I/O fencing

该功能以前由Oracle Process Monitor Daemon (oprocd)进程提供,cssdagen失败会导致集群重启该节点

Oracle ASM

该进程为集群件和数据库提供磁盘管理,即上个专题中的ASM

Cluster Time Synchronization Service (CTSS)

为集群件提供时间管理服务

Event Management (EVM)

该后台进程负责发布由集群件产生的事件(Event)

Oracle Notification Service (ONS)

一个发布订阅服务用于用于Fast Application Notification (FAN) event的通信

Oracle Agent (oraagent)

该进程扩展集群件来支持一些复杂的资源

该进程在FAN发生时运行一些callout脚本,在11.1中叫做RACG

Oracle Root Agent (orarootagent)

一个特别的oraagent脚本用来帮助crsd管理属于root的一些资源,例如网络和 Grid VIP


2. Oracle集群进程总览

下图为与集群相关的进程的总图,括号中的r代表以root身份运行

Alt text Alt text

Oracle 集群启动过程

Alt text

这里只是大概说明下,具体后续会详细介绍