分类目录归档:RAC

11.2 RAC 的启动过程

从11.2 GI(Grid Infrastructure)开始,RAC的结构跟10.2有翻天覆地的变化,在MOS的经典文档“11gR2 Clusterware and Grid Home – What You Need to Know (Doc ID 1053147.1)”中有详细的解释。 其中有一副经典大图可以一目了然的告诉我们这些d.bin进程之间的依赖关系(也就是启动和关闭,谁启动重启谁等等): 从CRS的启动过程,我们也可以清晰的看到进程的启动顺序。 下面是一个11.2.0.3环境的CRS启动过程: 最先启动的是/u01/app/11.2.0.3/grid/bin/ohasd.bin ,他后面呆着reboot,表示它被kill后会被自动reboot。 /etc/init.d/init.ohasd进程就是重启/u01/app/11.2.0.3/grid/bin/ohasd.bin进程的守护进程。 他们的内容都来源于$GRID_HOME/crs/init/init.ohasd,后续blog会模拟丢失这个文件到处理,这里不赘述了。 会自动启动这个进程,并在/var/log/message中记录下这个启动过程。 /u01/app/11.2.0.3/grid/bin/ohasd.bin被kill 后,,系统会有几分钟的重启服务的时间,/var/log/message中记录下这个启动过程: 这个重启的过程在空闲系统大概需要不到2分钟,$GRID_HOME/`hostname -s`/alert`hostname -s`.log中会ohasd.bin被kill和重启后执行检查(check)和恢复(recovery)各种资源的日志如下: 好了,继续回到我们刚才的启动过程的讨论。接下来,我们看到orarootagent.bin cssdagent cssdmonitor不见了,增加 mdnsd.bin 然后是增加了 ocssd.bin gpnpd.bin orarootagent.bin gipcd.bin osysmond.bin cssdmonitor … 继续阅读

发表在 RAC | 标签为 , | 留下评论

RAC环境下删除了/var/tmp/.oracle/的临时文件,有什么后果,以及如何处理

测试目的: 模拟RAC环境下有人误操作,删除了/var/tmp/.oracle/*下的oracle临时文件(删除Network Socket File) 测试过程:观察会有什么后果,以及如何处理。 . 测试环境:OEL 6.6 ,Oracle 11.2.0.4 Standalone(单实例使用ASM的环境) 如果是RAC,测试结论应该大体一致(机制类似)。 在Linux平台上,RAC或者HAS(单实例使用ASM的环境,比如standalone或者我们说的Oracle Restart)使用的Network Socket File在/var/tmp/.oracle/*文件: (在其他平台(比如, AIX HPUX等等)Network Socket File可能在:ls -lrt /tmp/.oracle/* /tmp/.oracle 或者 /usr/tmp/.oracle) 使用crsctl stop has -f停止has,然后就可以直接删除/var/tmp/.oracle/* 下面的Network Socket File: 如果/var/tmp/.oracle目录不存在,可以手工重建: 如果在has正常运行的状态下删除上述oracle临时文件,那么数据库可以使用,但是不能正常关闭: 可以看到,这时,crs通信异常了。 我们看下数据库: 这里看到数据库可以正常使用,但是不能关闭,关闭是报错:不能跟CSS进程通信。 数据库的alert显示为: 检查一下oarcle的进程: … 继续阅读

发表在 ASM, Oracle 11.1 & Oracle11.2, RAC | 标签为 , | 留下评论

Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列-9-Linux 7.2上的virbr0设备

当我们安装了Linux 7.2(CentOS 7.2和 OEL 7.2都有下面的现象),缺省会安装一个虚拟网卡virbr0。 查看当前的IP信息: 这里我们看到Linux7开始使用enp0s3作为第一个缺省的网络接口名,类似于以前的eth0,当然,你后面可以修改这个缺省的网络接口名。 enp0s8是第二个网络接口名,而enp0s9就是我们新添加的第三个网络接口名。 enp0s3和enp0s8我们在安装时已经配置了网络连接和IP地址,设置了启动自动连接,因此没有问题。 enp0s9需要我们手工配置。 . 可以看出来,Linux7中缺省还有一个virbr0网络接口。 . 从网上摘录了virbr0的部分相关解释: virbr0 是一种虚拟网络接口,这是由于安装和启用了 libvirt 服务后生成的 libvirt 在服务器(host)上生成一个 virtual network switch (virbr0),host 上所有的虚拟机(guests)通过这个 virbr0 连起来。 默认情况下 virbr0 使用的是 NAT 模式(采用 IP Masquerade),所以这种情况下 guest 通过 host 才能访问外部。 . 可以看出来,virbr0是一个虚拟网卡,并且由于在Linux7.2中(CentOS … 继续阅读

发表在 Installation and Deinstall, Linux, ORACLE 12C, RAC | 标签为 , , , , , , | Comments Off on Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列-9-Linux 7.2上的virbr0设备

Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列-8-在Linux7上安装11.2 RAC和12.1 RAC需要禁用哪些服务

安装Oracle RAC的时候,通常我们会禁用一些服务,比如:防火墙,avahi-daemon等等。 avahi-daemon是一种Linux操作系统上运行在客户机上实施查找基于网络的Zeroconf service的服务守护进程。 该服务可以为Zeroconf网络实现DNS服务发现及DNS组播规范,它可以在没有 DNS 服务的局域网里发现基于 zeroconf 协议的设备和服务。 用户程序通过Linux D-Bus信息传递接收发现到网络服务和资源的通知。 一般安装Oracle RAC,建议禁用该服务。 . 我们看一下,在Linux7(Linux5和Linux6中)以前我们一般禁用的服务列很多 例如: 等等 然后,在linux7下,已经不适用chkconfig命令了,而且很多以前的服务名称和启动配置都变化了(参考blog中Linux7管理开机启动服务的相关文章) 那么我们现在怎么禁用服务,禁用哪些呢? 首先,看看系统中当前运行了哪些服务: 在前面的blog中已经有了禁用防火墙的描述,这里不赘述。 安装Oracle,除了防火墙和SELINUX以外,通常还需要禁用以下服务 Linux7以前的命令: 在Linux7中使用systemctl stop和systemctl disable: 在Linux6以前,我们使用chkconfig –list查看当前的服务,但是在Linux7中,大部分情况我们使用systemctl 如果使用chkconfig –list,则输出类似如下: 执行chkconfig的命令提示很清晰,他告诉我们,使用chkconfig将只显示SysV的服务,不包含原生 systemd服务。 我们查询一下在Linux5和6时,咱们经常禁用的服务,在Linux7中的状态: 根据上面输出,可以总结出来,还需要禁用下面这些开机自动启动的服务: (systemctl disable的作用类似于以前的chkconfig –level 2345 avahi-daemon off) … 继续阅读

发表在 Installation and Deinstall, Linux, ORACLE 12C, RAC | 标签为 , , , , , | Comments Off on Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列-8-在Linux7上安装11.2 RAC和12.1 RAC需要禁用哪些服务

Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列–5-防火墙

一般安装Oracle,我们会禁用防火墙和SELINUX等一些列服务,并设置开机不自动启动(disable这些服务)。 比如,防火墙,在Linux7以前的命令: service NetworkManager stop service iptables stop service ip6tables stop 还可以使用systemctl查看防火墙服务: 当前防火墙的服务是开启的,并且开机自动启动,开机自动启动时读取/usr/lib/systemd/system/firewalld.service定义文件。 关闭防火墙: 设置开机不自动启动防火墙服务: 这里看到开机不自动启动的本质是在/etc/systemd/system/中删除防火墙服务的定义文件 再次查看防火墙状态: 上述说明防火墙服务已经被安装了,但是没有设置为自动启动。 可以看到,在Linux7中,systemctl disable一个服务,其本质是将该服务的配置文件的link删除。 然后,将该服务实际的配置文件内容修改为开机不启动进程: 其中: 这个表示firewalld.service要先于上面3个服务启动: 下面的设置表示不fork进程,没有pid: 检查iptables和ip6tables: 可以看到当前服务没有启动,且没有安装这个服务: 如果安装的服务会有类似下面的信息: Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列–1-简介 Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列-2-修改主机名和hostnamectl工具的使用 Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列–3-systemd(d.bin和ohasd守护进程) Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列–4-target(图形界面和字符界面) Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列–5-防火墙 Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列–6-开机自动启动或者禁用服务 Linux7(CentOS,RHEL,OEL)和Oracle … 继续阅读

发表在 Installation and Deinstall, Linux, ORACLE 12C, RAC | 标签为 , , , , , | 留下评论

Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列–4-target(图形界面和字符界面)

systemd可以创建不同的状态,状态提供了灵活的机制来设置启动时的配置项。这些状态是由多个unit文件组成的,状态又叫做启动目标(target)。 unit文件可以控制服务、设备、套接字和挂载点,这些文件存放在下面的两个目录下: /etc/systemd/system/ /usr/lib/systemd/system/ 其中/etc/systemd/system/的优先级更高。 如果需要创建自己的unit,可以修改第一个目录中的文件来进行自定义配置,而第二个目录中的文件是package安装时保存的备份。 比如在Linux7.2(CentOS,RHEL,OEL)12.1.0.2和12.2beta版本的Oracle GI程序就需要自己手工创建ohasd的服务(这是bug),后续文章陆续会讲解到。 目录/etc/systemd/system/目录中只有很少的配置文件,在这里面配置的服务优先级高于配置在/usr/lib/systemd/system/中的服务: 基本target中,只有微码服务: sysinit的目标: 缺省目标: 多用户字符界面的目标(runlevel 3): 而/usr/lib/systemd/system下面定义的unit就太多了: 从Linux7开始,不使用inittab作为启动配置文件,其内容仅仅是个说明: 从上面的说明不难看出,systemd不使用inittab作为配置文件,因此在这里添加的服务将不会生效 systemd使用’targets’代替了runlevels,我们常用的两个targets(启动到图形界面和启动到字符界面): 其中,multi-user.target类似于以前的runlevel 3,也就是字符界面的多用户模式 graphical.target就是以前的runlevel 5,即图形界面模式。 可以使用systemctl get-default来查看缺省的target,也可以使用systemctl set-default来设置缺省的target。 . 查看当前正处在哪个target中: 查看默认target: 也就是当前运行在多用户字符集面的模式。 查看当前所有的运行级别的定义: 这里我们看到了熟悉的 运行级别的身影: 查看当前的正处在哪个target中: 可以看到当前处在runlevel的运行界别类似于以前的level 3 ,即字符界面启动的 我们切换到图形界面启动的运行级别(类似于以前的runlevel 5): 这时候我们可以看到关键字:graphical.target 查看当前缺省的运行级别: … 继续阅读

发表在 Installation and Deinstall, Linux, ORACLE 12C, RAC | 标签为 , , , , , | 留下评论

Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列–3-systemd(d.bin和ohasd守护进程)

Linux的系统启动大致有3种主要模式: (1)Linux5和以前的版本:SystemV style的runlevel式启动 (2)Linux6中:以upstart(例如,在ubuntu中)代表的event-based启动方式 (3)Linux7中:以systemd模式并行启动的模式 . 前面两种启动模式的大致都有如下过程: 1,内核引导(内核被载入内存并运行,初始化所有的设备驱动程序和数据结构等) 2,启动/sbin/init,它是一个由内核启动的用户级进程 3,由/sbin/init启动其他用户级的进程或服务(这些进程大多数是各种daemon进程,即各种服务进程),最终完成系统启动的全部过程 所以,init始终是第一个进程,其PID始终为1,它是系统所有进程的父进程. . 第三种方式就是Linux7中采用的sytemd的方式,systemd不通过init脚本来启动,而是采用一种并行启动服务的机制(用缓存机制解决服务的依赖关系)。 这种方式的特点是与 sysvinit 完全兼容、更清晰的服务依赖关系、开机系统初始化服务并行启动、更少的shell开销。 systemd使用 socket 和 D-Bus 来开启服务,提供基于守护进程的按需启动策略 每个服务就是一个 unit,对应于运行级别,systemd有一个 target (multi-user.target)。 . 在Linux4和5中: 在Linux6中: 在Linux7中已经不适用init进程启动了: 这里面的3个“/usr/bin/ssh-agent /etc/X11”进程是Linux7中配置了自动启动VNC。 . 这3种模式的不同在于: 1,SystemV style的runlevel式启动 在Linux5和以前的版本,init进程会读取/etc/inittab的内容,/etc/inittab中包含了很多启动其他用户进程和服务的指令。 因此,/etc/inittab的内容就决定系统进入哪一个runlevel,然后去/etc/rcN.d/(N代表runlevel的数字表示)去找相应的启动脚本。 即: /sbin/init => … 继续阅读

发表在 Installation and Deinstall, Linux, ORACLE 12C, RAC | 标签为 , , , , , | 留下评论

Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列-2-修改主机名和hostnamectl工具的使用

测试目的: 熟悉Linux7中修改主机名的机制和hostnamectl工具的使用 测试环境:CentOS Linux release 7.2.1511 (Core) 主机名的配置,在Linux7以下的版本主机名一般是看: 1,配置文件/etc/sysconfig/network 2,命令hosntame 但在Linux7中(这里是CentOS 7.2)中,很多系统管理工具都被替换了,包括主机名的配置。 . Linux7中采用新的配置文件/etc/hostname,替代了Linux7以前(Linux2~Linux6)中使用的/etc/sysconfig/network文件 不过,/etc/sysconfig/network文件还在,只是其内容只剩下一行标注为Linux安装管理程序的“# Created by anaconda”: 这里看到的Anaconda是RedHat、CentOS、Fedora等Linux的安装管理程序的名字,其大部分模块用Python编写,有少许的载入模块用C编写。 . 从Linux7开始使用/etc/hostname来管理主机名的配置信息: 在Linux中,有三种定义的主机名: 静态的(static),“静态”主机名也称为内核主机名,是系统在启动时从/etc/hostname自动初始化的主机名。 瞬态的(transient),“瞬态”主机名是在系统运行时临时分配的主机名,例如,通过DHCP或mDNS服务器分配。 灵活的(pretty)。“灵活”主机名则允许使用自由形式(包括特殊/空白字符)的主机名,以展示给终端用户(如Dan’s Computer)。 静态主机名和瞬态主机名都遵从作为互联网域名同样的字符限制规则。 . 只查看静态、瞬态或灵活主机名,分别使用“–static”,“–transient”或“–pretty”选项。 例如: 但是在Linux7中,有个叫hostnamectl的命令行工具,它允许你查看或修改与主机名相关的配置。 我们看一下hostnamectl的帮助信息: 修改配置文件/etc/hostname,注释掉缺省的第一行,添加我们以前习惯的不带域名的主机名lunar: [root@localhost ~]# 再次查看: 修改完配置文件/etc/hostname后,这里看到我们修改后的信息: Static hostname以前的“localhost.localdomain”变成注释的,也就是/etc/hostname中被注释的一行 Transient … 继续阅读

发表在 Installation and Deinstall, Linux, ORACLE 12C, RAC | 标签为 , , , , , , | 留下评论

Linux7(CentOS,RHEL,OEL)和Oracle RAC环境系列–1-简介

去年开始测试Linux7.1的相关功能,包括CentOS Linux7的安装和OEL的安装 在Linux7.1(8月份已经release的是Linux7.2)上安装Oracle 11.2.0.4 RAC, Oracle 12.1 RAC,Oracle 12.2 beta Standalone等等大量测试。 由于Linux7在架构上改变较Linux6有很大改变,包括系统服务的架构,管理命令集等等 感觉上是几乎是重新学习了一下Linux的一些常用管理方法,就如同Oracle 10.2 RAC到11.2 Grid Infrastructure 的改变一样。 由于比较懒,之前没有总结,一段时间不玩,发现很多生疏了,记忆力不好是硬伤……因此,开始打算逐步总结一下,免得以后用的时候忘记了 :) . Linux7总体感觉启动很快,这个可能跟Linux7采用systemd的管理方式有关系 之前的Linux版本中,使用SysVinit一次一个的串行地启动服务。 系统启动按照/etc/inittab中定义的脚本顺序启动,这种启动服务的方式靠脚本控制,考虑服务之间的依赖关系,因此是顺序执行的 从Linux7开始,采用Systemd并行地启动系统服务进程,系统启动时并行启动多个预先配置的Unit 不同Unit之间的依赖关系使用缓冲的方法,将有依赖关系的服务请求放入队列 待被依赖的服务启动后,该服务继续获取执行,因此可以做到并行执行服务来快速启动。 而且Systemd最初仅启动确实被依赖的那些服务,极大地减少了系统引导的时间。 可以用下面的命令看到系统引导用时: 这里看到,开机时间是31秒左右,可见开机速度之快(关机也同样快)! . systemd命令非常丰富,通过查看help就可以看出来。 比如列出所有正在运行的单元: . 作为一个DBA,从安装开始熟悉一个新成品,然后通过逐步测试官方文档中的各种功能来熟悉产品已经成为习惯。 这就从安装RAC开始说起。 首先是OS的安装,因为考虑后面是为了跑Oracle,因此我选择OEL Linux7. 安装时如果后面不考虑静默安装RAC或者静默安装数据库,那么需要选择“带图形的服务器”(Server with … 继续阅读

发表在 Installation and Deinstall, Linux, ORACLE 12C, RAC | 标签为 , , , | 一条评论

11.2单机数据库转换为RAC-2-手工方式(与9i,10g,11.1的方法一样)

单机数据库转换为RAC,方法很多,前面的已经讲过使用rconfig的方法(11.2以后Oracle推荐的方法)。 但是我还是喜欢手工转换,感觉还是简单省事的,整个过程15分钟左右(主要是启动和关闭数据库的时间): 首先将单机数据库的pfile修改为RAC的pfile,具体如下: 然后使用这个pfile启动数据库: 然后添加thread 2的redo log group: 创建thread 2使用的UNDO TABLESPACE: 然后enable这个thread 2: 最后,执行创建RAC的一些必要试图的脚本: @?/rdbms/admin/catclust.sql 有些人说这个可以不执行,也有很多GV$的视图,但是实际上这个脚本是必须执行的,否则会缺少一部分GI需要视图 比如V$BH等等,具体可以查看catclust.sql脚本 都做完以后,就可以启动数据库了: 这里看到已经是RAC数据库了,RAC中最好使用spfile文件,因此我们也创建spfile,例如: 然后把这数据库加入到CRS,就可以由CRS来管理了:

发表在 RAC | 留下评论