5 node RAC 10g completed

昨天又干了一件大工程,搭建5节点的Oracle10g RAC,仍然是AIX 5L操作系统,盘阵是HP比较老些的XP128,不过也属于高端盘阵了,210块盘做ASM中的datagroup(用于存储数据文件),10块盘中ASM的flashgroup(用于flash recovery area),一块盘做OCR Disk,一块盘做Voting Disk。

总体安装过程简直可以用“完美”来形容,一个错误也没有发生,恩,我的意思是说实际上还是碰到了一个问题。:)

这个问题发生在10.2.0.3版本的racgvip脚本中,如果操作系统没有设置默认网关(Gateway),那么在安装完10.2.0.3补丁以后,vip资源将无法正常启动,而在之前的10.2.0.1中一切都是正常的。

老实说,实际上耗费了不少时间去找这个问题的原因,甚至修改了racgvip脚本来echo我自己需要的调试信息,这样才一步步追踪到错误信息输出之前的那步操作,是检查系统的default gateway,并且返回的变量值是null,然后询问系统管理员,得知系统确实没有设置网关。这时候,才发现原来在racgvip脚本的最开始有一个变量可以控制当系统没有默认网关时整个脚本是否还继续进行。

vi /oracle/crs/bin/racgvip

默认有一行
FAIL_WHEN_DEFAULTGW_NO_FOUND=1

需要将1修改为0
FAIL_WHEN_DEFAULTGW_NO_FOUND=0

然后再次启动crs,一切正常了。再之后就一帆风顺,平安到港。

下面最简单的描述一下在AIX 5L安装Oracle10g RAC的步骤。

1. 安装操作系统所需补丁
2. 设置存储,其中创建两个裸设备,一个给ocr disk,一个给vote disk
3. 修改所有节点中的/etc/hosts,/etc/hosts.equiv,~root/.rhosts,~oracle/.rhosts,这是给rsh用的
4. 修改所有节点中的~oracle/.profile,这是设置环境变量
5. 安装CRS
6. 安装Oracle 10.2.0.1 软件
7. 升级CRS和Oracle Software到10.2.0.3
8. 创建ASM实例,创建diskgroup
9. 创建数据库

10 thoughts on “5 node RAC 10g completed

  1. kamus says:

    to starlvzhen
    asm实例和db实例都是用一份oracle software的,不需单独安装

    to waityou81
    我知道单节点DB转成RAC并不是特别麻烦,但是不知道EBS有什么特殊需求吗?

  2. 木匠 says:

    有趣, 都是些啥 怪模怪样的稀奇问题!,
    如果必须检查Gateway, 那么安装指南里面就应该提到. (我想当然了)

    有参考价值,明年硬件升级到 IBM AIX.

  3. kamus says:

    我查了patchset的readme文件,里面并没有提到任何跟gateway相关的问题。它倒是有提到在升级CRS的时候会有一个“WARNING: TOC overflow”的报错,说这个可以忽略,这是我们也碰到了的。

  4. ztg says:

    2 设置存储,其中创建两个裸设备,一个给ocr disk,一个给vote disk
    两个裸设备就是两个lun吧?不是lv吧!这两个lun在aix需要做特殊设置吗?linux与solaris是不用的(不使用第三方群集软件),AIX我不熟悉

  5. ztg says:

    谢谢!回复
    不同品牌存储,修改reserve policy还不一样,被玩了
    reserve_lock=no;reserve_policy=no_reserve

Leave a Reply

Your email address will not be published. Required fields are marked *