RAC10gR2 on HP-UX IA64

这几天经历了有史以来最痛苦的Oracle 10gR2 RAC的安装体验。 操作系统是HP-UX IA64,原本是两台已经安装过Oracle10gR2 CRS+RAC的系统,在安装完之后做了安全控制,取消了很多服务,然后机器从北京搬到上海,存储换了(意味着OCR和Voting Disk没有了),主机名称换了,网卡ID换了,IP地址换了(意味着重新构建OCR Disk很麻烦),在这样的一台机器上要重新安装RAC。 多次的失败之后,要求HP工程师重新安装了操作系统,从上周五白天一直到今天晚上才完全搞定,在今天晚上22:00才最后发现原来一切一切不可思议的问题都是源自于一个小小的环节,以往几天甚至对CRS在HP-UX上的稳定性都产生了极大的怀疑。 现象是,css/crs/evm这些后台进程用ps看全部都是正常的,但是crs_stat命令始终报无法连接CRS Daemon;重新启动机器之后有时候一个节点正常了,但是另外一个节点不正常,再次重启,不正常的节点可能又正常了;好不容易两个节点都正常了,数据库软件也安装完毕了,数据库也创建了,最后再重启一下两台机器,CRS又不正常了。。。几乎抓狂! 最后,焦点聚集到网卡的全双工和半双工设置上,网络集成商在屡次确认网络配置确实没有问题之后,在客户的强烈要求下,最后又再次检查了一下交换机,发现交换机上有两个端口设置成了半双工+自适应,而主机上的网卡全部都是全双工+非自适应,而这两个端口恰恰是连接某台数据库服务器上的Public网卡。就是这个网络设置上全双工和半双工的不匹配,让CRS发生了各种古怪的现象。 一切问题都在把交换机端口也设置为全双工+非自适应之后荡然无存。 这篇文章的意思是:CRS不是想象中那么不稳定,如果在安装过程中或者安装完毕有奇怪的现象,那么第一个要找的不是CRS软件本身,而是操作系统以及网络设置。

How to change VIP interface in 10g cluster

凌晨2点出发到客户处加班,加班的目的是由于改动网卡而重新配置VIP资源。 IBM AIX5L的系统,安装的是10gR2 RAC,在最开始安装的时候,客户配置了HACMP,并且设置了Primary网卡和Standby网卡,同时HACMP还会管理这两块网卡,当Public网卡出现问题的时候IP会切换到Standby网卡,但是10g Cluster的VIP却无法应对这种情况,当发生IP切换,VIP就down了。本来客户如此考虑是为了避免网卡的单点故障,但是通过HACMP这样管理的方法却仍然无法避免VIP的单点故障,因此客户决定今天晚上重新设置网卡,将原本的Primary和Standby网卡bunddle成一块Public网卡,这样网卡的Interface Name就会发生改变,所以VIP资源就需要重新配置。 修改VIP资源的步骤大体如下。 1. 停止数据库,CRS $ srvctl stop database -d grid $ srvctl stop nodeapps -n node1 $ srvctl stop nodeapps -n node2 2. 修改OCR中的信息 删除原先的信息 $ORA_CRS_HOME/bin/oifcfg delif -global eth1 添加新的信息 $ORA_CRS_HOME/bin/oifcfg setif –global eth0/192.168.2.0:public 检查是否添加成功 $ORA_CRS_HOME/bin/oifcfg getif 3. 用root用户修改nodeapps 因为修改必须在 Oracle Clusterware stack启动状态下进行,因此上面一步要用srvctl stop nodeapps来停止资源而不要使用crsctl stop crs来停掉整个Clusterware。 # srvctl modify…

10g RAC培训 – 1

今天在上地6号参加RAC Pack的培训,讲师是来自RAC Pack核心Team的roy.rossebo和su.tang以及北京的paulo.qiu。 第一天仅限于在Redhat上安装CRS+ASM+DB,基本上没有太多技术问题,整个下午的讨论似乎有些偏离这次Training的主题,都聚焦在Oracle的Patch机制上。 为什么会有Merge Label Patch,为什么又有Bundle Patchset,怎么通过内部的Wiki站点查询已经发布的和即将发布的Merge Label Patch,对于不是RAC的系统在哪儿可以查到推荐的Patchset,对于是RAC的系统又在哪儿查询。 更Detail的技术问题应该在后面几天会涉及到吧。 最后培训结束以后,跟ACS的几位同事聊天,得到了一堆稍显粗糙但是又颇为贴切的对于Oracle售后几个部门的比喻。 我问他们,ACS和GCS有什么不同,他们说: OSS中的ACS就好比小姐出台,因为是到客人处上班的短期行为。 OSS中的GCS就好比小姐坐台,因为是在公司处理热线的长期行为。 于是我恍然大悟,跟他们说: 那这样,OCS就好比二奶,因为是在客人处上班的长期行为。 那,老婆是什么呢,是集成商啊。。。 哈哈,大家一笑。