分类目录归档:日常运维

在Double-E之间配置基于Infiniband的SDP连接(比如,两个Exadata,或者1个Exadata和1个Exaligic之间)

在Double-E之间(比如,两个Exadata,或者1个Exadata和1个Exaligic之间),我们可以使用IB来连接 比如两个Exadata之间互相做灾备(ADG) 再比如,Exalogic上有大量的空间,即使是1/4配置的Exalogic上也有几十T的容量空闲(没有部署应用的空间)。 有时候我们会见可以购买了Double-E的客户用这个空间来做Exadata上的数据库的ADG。 为了充分利用IB的传输速度块,低延迟和CPU消耗少等优点,Double-E之间的互联,一般建议通过SDP协议访问Exadata上的数据库 文档建议(Exadata X2和X3),Exadata和Exalogic使用8个IB线进行连接(4跟的话也可以,但是没有冗余,一般不建议) Exadata 1/4 rack和Exalogic 1/4 rack上分别都有2个叶IB交换机(半配的会有第三个主IB交换机,从Exadata X3开始,出厂时缺省没有最下的主交换机了) 这4个交换机如下: Exadata-IB1 Exadata–IB2 Exalogic-IB1 Exalogic–IB2 连接方式: Exadata-IB1——-Exalogic–IB2 Exadata-IB1——-Exalogic–IB1 Exadata-IB2——-Exalogic–IB1 Exadata-IB2——-Exalogic–IB2 配置方式具体如下: 1、修改db node上的/etc/infiniband/openib.conf: 2、在/etc/ofed/libsdp.conf中添加: 3、在/etc/modprobe.conf都添加并且reboot节点: 配置Double-E(比如Exadata和ExalogicIB,或者Exadata和Exadata之间的)网络上配置监听: 添加network2(for IB): 验证添加结果: 添加vip: 检查vip是否可以正常启动: 添加这个IB网络的监听(LISTENER_IB): 配置tnsnames.ora 修改数据库参数listener_networks: 测试连接,使用oracle用户: 在客户端(Exalogic或者其他需要连接db的主机上),需要配置 如下连接串: … 继续阅读

发表在 Exadata, 日常运维 | 标签为 , | 留下评论

exadata巡检报告的模板

最近有几个兄弟要exadata巡检报告的模板,完善了一下,大概200页左右: 由于里面有大量客户的资料,因此暂时设置为需要口令下载的,有需要的兄弟直接联系我 后续如果有机会,将不断更新,加入新的内容,O(∩_∩)O哈哈~ 不过现在没有环境了,有需要的可以跟我联系,我免费检查,这样一举两得,我完善了自己的知识库,朋友们可以完成工作任务,O(∩_∩)O哈哈~ Exadata_HealthCheck_模板下载地址: Exadata_HealthCheck_模板

发表在 日常运维 | 标签为 , , | 10 条评论

我在Oracle的第二个ppt——Exadata运维交流

在Oracle工作8年了,这是第二个ppt,最满意的我学会了修改ppt模板,O(∩_∩)O哈哈~ 本次交流的主要能容源于本网站,主要是跟同事一起交流Exadata运维中的常见问题,以及如何更好的为客户做好Exadata的相关服务。 Exadata运维交流

发表在 日常运维 | 2 条评论

使用 DECLI 配置Exadata上cell节点的celladmin的信任关系

在Exadata上缺省没有配置cell节点的celladmin用户的信任关系,但是有时候我们需要用,那么手工配置一下吧。 借助dcli工具,使得配置很简单:

发表在 FAQ, 日常运维 | 留下评论

在Exadata上修改操作系统用户口令的方法

注意修改完了要用这个用户登录一次才可以:

发表在 FAQ, 日常运维 | 留下评论

Exadata上的常用工具介绍(Troubleshooting Tools)

Utility Path Usage/Comments Infiniband Some of these tools may be found in /opt/oracle.SupportTools/ibdiagtools on cells or database servers. Also see the  Infiniband Triage wiki page. /opt/oracle.SupportTools/ibdiagtools/infinicheck /opt/oracle.SupportTools/ibdiagtools/verify-topology ibqueryerrors /usr/bin/ibdiagnet Detecting fabric issues /usr/sbin/ibaddr Examining HCA state & guids /usr/sbin/ibcheckerrors Detecting fabric issues … 继续阅读

发表在 FAQ, 内部机制, 故障诊断, 日常运维 | 标签为 , , | 留下评论

为Exadata 服务器创建共享文件系统(DBFS)

DBFS是Oracle 11.2的新特性,他提供了在Linux操作系统中将Oracle的ASM数据库映射成文件系统来使用的功能。操作上的文件在DBFS内部是以SecureFiles LOBs(SecureFiles LOB是11.1的新特性,对比与以前的BasicFiles LOBs,Oracle称SecureFiles LOBs为全新设计的LOBs)的形式存储在数据表中。由于篇幅关系,这里不详细描述SecureFiles LOBs了。 其配置过程非常简单,具体参见MOS: Configuring a Database for DBFS on Oracle Database Machine [ID 1191144.1] List of Critical Patches Required For Oracle 11.2 DBFS and DBFS Client [ID 1150157.1] 在Exadata上数据库节点的本地磁盘空间是有限的,因此,在做数据加载时,我们需要想办法使用更大的空间来存放数据(以便后续加载到exadata上的数据库中),通常,DBFS是一个很好的选择。 如果经常使用的话,写一个shell自己动完成所有过程,测试过,也就是几分钟,O(∩_∩)O哈哈~。 下面详细讲解一下配置的过程: 配置DBFS 文件系统 为Exadata 服务器创建共享文件系统(DBFS) … 继续阅读

发表在 FAQ, 安装和升级, 日常运维 | 2 条评论

安装Exadata时,如果checkip有报错怎么办?

在安装老版本 Exadata (Image 11.2.3.2.0以前)时,我们通常会使用一个叫做 的excel来完成环境配置,并生成和这个 onecommand 配套的配置文件。 大概在2013年1月份后,新的版本 Exadata ( Image 11.2.3.2.0以后 )上,我们会使用一个基于java的onecommand工具,图形化的生成配置文件。 通常安装前,我们会跟客户有一个沟通,把Exadata上的各个网络配置等信息跟客户做一个充分沟通,然后根据客户的要求使用onecommand生成配置脚本,其中有一个checkip.zip 这个checkip.zip(使用里面的 checkip.sh )我们会交给客户,用来检查现有环境。 有时候,运行checkip后,发现错误,不是说环境就一定不ready,需要看具体的情况而定: 例如:先插现有环境,发现有2个地方放报错了: 这里,我们发现了两个错误,但是这两个错误是不是致命错误,以至于不能安装呢? 我们来检查一下 checkip.sh 的详细日志,分析下,到底什么问题: [root@dm01db01 onecommand]# cat dbm.out 从上面的分析,我们可以看到,主要是2个错误: 1,在onecommand中生成配置文件时填写了两个DNS,但是安装的时候,我们的环境当时只配置了一个DNS Server 2,在2个PDU上连接网线到Exadata内置的Cisco交换机 这些都是非致命的问题,解决方法: 1,重新生成配置文件,只填写一个DNS 2,给PDU加上连线,连接到Cisco 再或者,其实这2个错误,可以忽略,O(∩_∩)O哈哈~

发表在 日常运维 | 标签为 , | 一条评论

Exadata 环境下修改NTP Server的方法

如果NTP SERVER 的配置有问题,那么在使用 onecommand 进行安装时,会在最初的环境校验过程报错。 当然,从11.2.3.2.0开始,Exadata 上执行 onecommand 之前,必须先使用 checkip 脚本进行环境验证,如果该脚本返回关键错误,那么必须先根据提示解决问题,再继续安装。 例如,“Step 0 = ValidateEnv”就是执行环境校验: 这里我们看到NTP server在安装时都已经ok了: 在使用中,有时候客户有更改NTP SERVER的IP的需求。 如果没有在 Exadata 的db节点和cell节点上完成相应配置文件的修改,那么cell节点的alert中会类似如下报错: 此时,在cell节点上验证会报失败“FAILED”: 场景1:使用过程中,客户更改了NTP Server的解决方法 解决方法: 直接修改/opt/oracle.cellos/cell.conf,将10.9.26.230替换成 10.9.26.62 修改之后,再次使用“ /usr/local/bin/ipconf -verify -semantic ”来验证。 可以看到,已经验证通过了: 场景2:初始安装过程中,错误的填写了NTP Server的地址 解决办法: (1)重新生成配置文件: 按照新的NTP SERVER的IP,重新生成配置文件。 … 继续阅读

发表在 日常运维 | 标签为 , | 留下评论

使用ILOM收集Exadata的硬件故障信息(snapshot)

    当遇到硬件故障时,我们通常会收集硬件故障的信息提交到SR或者硬件工程师,那么如何收集故障信息呢? 在Exadata或者配置了ILOM模块的X86机器上,我们都可以使用两种方法收集信息。 方法一,使用Web界面登陆ILOM: 点击run后,会弹出一个窗口让你选择将收集的信息保存在那个目录,之后,点击保存按钮,然后就可以将这些日志发送到SR或者给硬件工程师确认。 这个过程也可以通过命令行完成。 方法2:使用命令行收集故障信息,大致步骤如下: 使用SSH登陆故障节点的ILOM(IP地址在配置文件中可以查找到): 这里dump_uri的格式如下: 执行完这不后,看到“Snapshot Complete”提示就可以完成了. 生成的日志在该主机的(这里是 192.168.1.2 )的“/tmp”目录下。

发表在 日常运维 | 标签为 , | 留下评论