在客户一次停机维护中,发现了这个问题。
环境是ORACLE 10G RAC for AIX6,使用了HACMP管理共享磁盘。
在停机维护时间段内需要重启主机,当关闭了数据库和CLUSTER后,节点1使用reboot命令重启操作系统,等了很长时间,系统仍然没有启动的迹象,不得以到机房中检查,发现服务器处于关机状态。
手工启动服务器后,发现HACMP启动报错,原因是/etc/snmpdv3.conf文件被清空。将另外节点的文件拷贝到当前节点上,HACMP和RAC环境顺利启动。
而节点2同样采用reboot操作,同样服务器没有自动重启而只是关机,手工启动后发现ORACLE_HOME所在盘出现错误,必须要执行fsck命令,结果检查出几个不一致的块,并且丢失了一些文件,好在出问题的都是Oracle产生的trace文件,fsck结束后该盘顺利挂载。
特意检查了一下reboot命令,发现这个命令在单用户模式下是重启服务器,而多用户模式下,该命令只是关机,而且可能会导致文件系统的损坏。
正确的重启方式是shutdown –Fr,随后又进行了两次重启,都采用了shutdown –Fr方式,没有碰到任何问题。
时间: 2024-10-25 00:35:10