分类目录归档:RAC

11.2 RAC 上所有grid环境需要的文件的权限配置文件:crsconfig_fileperms

在11.2的$GRID_HOME/crs/utl目录下有一个文件crsconfig_fileperms,记录了所有grid目录下各个文件的权限定义,例如:

发表在 RAC | 标签为 , , | 留下评论

11.2 RAC 上所有grid环境需要的目录的权限配置文件:crsconfig_dirs

在11.2的$GRID_HOME/crs/utl目录下有一个文件crsconfig_dirs,记录了所有grid目录下各个目录的权限定义,例如:

发表在 RAC | 标签为 , , | 留下评论

11.2 RAC 修改了目录权限(u01)后crs不能启动的解决方法-1-手工修复错误的权限

在11.2RAC中,如果修改了gird的安装目录(类似chown -R xxx /u01),比如通常我们会使用/u01,则crs会出现不能启动的状态,启动时,mdnsd进程会首先卡主,crs日志会有如下信息: 下面我们尝试使用3种方法来修复该问题。 方法1————直接修改/u01和其他相关文件或者目录的权限: 注意: 此方法,仅仅用于紧急启动数据库或者ASM的不得已的做法,在生产环境下,官方建议的做法是删除节点和添加节点(后面会在方法3中详细描述)。 首先修改/u01目录为grid:oinstall,并修改/u01/app/oracle为oracle:oinstall 如果进行上述目录权限的修改,那么crs表面可以启动,但是可以看到后台重要的agent进程都是错误的状态: 还有一些对ohasd和crsd比较关键的文件的权限,也一并修改了: 此时启动可以crs可以启动了。 但是,可以看到目录权限有问题的节点,数据库没有正常启动: 手工启动数据库,报错信息如下: 这个错误通常意味着oracle二进制文件权限不对,尝试修改: 正常情况下,$GRID_HOME/bin/oracle和$ORACLE_HOME/bin/oracle的权限都应该是6751,即“-rwsr-s–x” 对比下节点2(正常节点): 再看看节点1(问题节点): 手工修改$GRID_HOME/bin/oracle文件权限: 顺便检查一下$ORACLE_HOME/bin/oracle文件权限: 现在,再重新启动数据库: 目前该数据库貌似可以启动了,如果在很多异常情况下,目前的情况,已经可以尝试导出数据库或者备份数据库等等了。 但是这种状态的crs和数据库是存在很大隐患的,比如很可能会异常宕机或者出现其他莫名其妙的损坏等情况。 因此,一旦权限出现问题,要么使用rootcrs.pl -init修复(通常这种情况下,这种修复是徒劳的,后面的测试会证明这一点) 否则官方不支持任何手工手工修改权限的做法。就这一点,官方有明确的:

发表在 RAC | 标签为 , , | 留下评论

更改db_unique_name后,修复磁盘组依赖关系和其他crs中的相关配置

做ADG时,修改了数据库的db_unique_name后,alert中报错如下: 这个错误不影响使用,但是终归是别扭的…… 检查crs中数据库的配置: 这里可以看到,以前的spfile(主库的)位置是:+DATA/lunardb/spfilelunardb.ora 此时,即便是手动修改了参数文件位置为 SPFILE=’+DATA/mynewdb/spfilemynewdb.ora’,重启crs后,启动数据库也会有报错信息: 因为它还是自动修改为crs的db资源中的信息,并把以前我手工修改的信息做了备份: 可以修改crs中db的spfile位置: srvctl modify database -d lunardb -p ‘+DATA/mynewdb/spfilemynewdb.ora’ 再次检查,可以发现spfile位置已经正确了: 这里很显然,除了spfile位置,Database unique name也是不对的,因为crs中保存的db信息是根据db_unique_name来判断的,只能通过remove database,然后再add database,add instance等等: 好了,alert中信息正常了:

发表在 RAC | 标签为 | 留下评论

Standalone – 修改主机名和IP地址

新本本性能一般,用VM跑RAC很费劲,因此从朋友那里copy了一个STANDALONE(ASM+SINGLE DATABASE),然后直接修改主机名后,发现css信息异常,且HAS不能启动…… 直接修改主机名为lunar后,HAS的信息为: 重启has后,发现HAS启动不了,报错如下: 根据“error location: scrsearch1”和“cant open scr home dir scls_scr_getval”,可以看出这个跟修改主机名有关系,将主机名称修改会议前的dabaobao: 修改回到以前的主机名“dabaobao”以后,再次重启has,可以启动了,可见,HAS的架构非常简单…… 这里,出了ora.DATA.dg这个资源异常外,其他资源是正常状态,此时,我们使用roothas.pl删除HAS的配置: 然后,修改主机名为lunar,再次使用roothas.pl,让他自动根据当前的主机名和IP来生成配置信息: 可见,这里已经生产了节点名为lunar的has配置信息 添加asm: 添加ASM DISKGROUP: 这个错误是因为没有找到合适的disk,于是修改参数: 可以看到,现在磁盘组都mount上了 然后我们创建spfile,准备重启has: 重启HAS: 等待一会儿,一切ok了: 总结: 1,在发现has或者crs异常时,不要stop crs或者stop has 2,修改主机名或者IP时,发现错误了,不要stop crs或者stop has(后续的一些操作需要这些资源) 3,在HAS环境中修改主机名和IP的过程: (1)先用roothas.pl -deconfig -force清理老配置 (2)修改主机名(/etc/hosts,/etc/sysconfig/network,hostname等等) (3)./roothas.pl (自动根据当前配置生成新的配置信息) (4)添加ASM资源 (5)添加磁盘组 … 继续阅读

发表在 ASM, RAC | 标签为 , , | 留下评论

如何查看你的环境是否是RAC环境? 如何判断你有哪些option?如何enable或者disable他们?

前几天一个老同事问我,客户不想买RAC 的license了,怎么办? 因为当时他们有其他机器安装新环境,因此,我当时就说,直接装一个单机库,把数据库迁移过去,cluster_database改成false,再清理掉thread,undo,redo就ok了。。。 今天忽然想起来,如果客户不买partition选项了,想关闭这个怎么办?或者客户没有新机器再装一个ORACLE_HOME了,怎么办? 后面的我们就研究下: 首先我们可以使用OUI或者opatch去看已经安装了哪些选项(当然,还可以看数据库视图) 方法1: 使用OUI去review ./runInstaller 里面有一个 “Installed Products”,这个是你已经安装的产品 方法2:使用OPATCH [oracle@lunar lib]$ opatch lsinventory -detail Invoking OPatch 11.2.0.1.7 Oracle Interim Patch Installer version 11.2.0.1.7 Copyright (c) 2011, Oracle Corporation. All rights reserved. Oracle Home : /u01/app/oracle/product/11.2.0.3/dbhome_1 Central … 继续阅读

发表在 FAQ, RAC | 标签为 , , | 留下评论

随心所欲的指定RAC中的节点号

考虑到节点逐出的规则,其中有一个跟节点号有关系,即缺省节点号小的被保留,大的被逐出(还有很多其他条件,比如分组等,这里不细说) 那天群里有人说了希望修改节点号的需求,今天忽然想起来试试看,结论如下: 1,可以使用ocrpatch任意指定任一个节点的节点号 2,不指定的情况,安装的节点为节点1,其余的顺次往下排 备份下当前OCR和VOT的信息: 这里,我们可以看见,节点1(rac1)的节点号是1,节点2(rac2)的节点号是2。。。 我打算把它修改为节点1(rac1)的节点号是2,节点2(rac2)的节点号是1 只读模式使用ocrpatch: 好了,现在我们来修改下 再开2个会话,分别用于停止节点1和节点2的crs: 注意这里,节点1,貌似hang住了。。 节点2已经clear shutdown了 于是想起来了,还有一个ocrpatch的窗口,退出后,大概几秒钟,继续shutdown: 在节点1以独占模式启动cluster: 把voting disk放到文件系统上: 以write read方式访问ocr: SYSTEM.css.nodenum_hint ,这个表示他们的 “preferred” node number ,这个是节点1,我们看到设置为1,现在,我们把它设置为2,然后观察下: 已经修改成功了。 ocrpatch> exit [OK] Exiting due to user request … [root@RAC1 tmp]# 现在,使用独占模式启动crs: 检查状态,都正常: 初始化votdisk: … 继续阅读

发表在 ASM, RAC | 标签为 , , | 留下评论

4种查询vot的方法和4种查询ocr的方法

一、查找voting disk 的4种方法 方法1: 方法2: 方法3: 方法4: 这里可以看到au是1M,voting disk从AU 192开始,到AU 224结束,共32个AU : 跳过了头上的192M,dump了后面的32M内容,也就是我们需要的VOTING DISK的32个AU的内容 二、查找ocr的方法 方法1: 方法2: 方法3: ocrdump 方法4: 这里看到ocr的文件号是255,可以根据文件号查询AU:

发表在 ASM, RAC | 标签为 , , | 留下评论

安装oracle 11.2.0.1 RAC和11.2.0.4 RAC on aix 7.1

<head profile=”http://gmpg.org/xfn/11″> <style type=”text/css”>#header { background: url(http://feed.askmaclean.com/wp-content/themes/minimum/images/header.png) no-repeat !important; }</style> </head> lunardb2/#oslevel -r 7100-02 lunardb2/# /usr/sbin/lsattr -E -l sys0 -a realmem /usr/sbin/lsps -a /usr/bin/df -g /usr/bin/df -g /tmp bootinfo -K lsattr -El rhdiskpower0 -a size_mb lsattr -El hdiskpower0 /usr/sbin/no -a … 继续阅读

发表在 Installation and Deinstall, RAC | 标签为 , , | 留下评论

AIX环境下11.2 rac的快速卸载脚本

以下脚本(支持11.2.0.4和以前的11.2版本),如果不是很熟悉自己环境或者脚本含义,可以逐步执行: crsctl stop crs crsctl disable crs rm /etc/rc.d/rc2.d/K96init.crs rm /etc/rc.d/rc2.d/S96init.crs rm -f /etc/init.tfa rm -f /etc/inittab.tfa rm -f /etc/init.ohasd rm /etc/inittab.crs cp /etc/inittab.no_crs /etc/inittab rm -rf /etc/oratab rm -rf /etc/oraIn* rm -rf /etc/oracle* rm -rf /etc/ora* rm -rf $ORACLE_BASE … 继续阅读

发表在 Installation and Deinstall, RAC, Scripts | 标签为 , , | 留下评论