AIX常规检查与排错

一、AIX系统管理日常健康检查与监控

1.检查文件系统

命令:df -k(或df -m、df -g)

除了/usr文件系统,其他文件系统不应太满,一般不超过80%

如果发现文件系统空间不够,方法有两种

a.找出占用空间最大的文件

命令:du -sk * | sort -r n | head

查找当前目录下占用剑最大的子目录,逐层往下找,删除无用文件,释放空间

b.增加文件系统大小

命令:smit chfs

注意:卷组中要有剩余空间

2.检查系统完整性

命令:

umount filesystem_name

fsck filesystem_name

fsck -y filesystem_name

注意:文件系统必须先umount,再检查和修复,否则可能出错

3.查看卷组信息

命令:lsvg -l vg_name

如果发现有处于stale状态的卷组,尝试使用以下命令同步修复

命令:syncvg -v vg_name

或smit syncvg

4.检查内存交换区(paging space)使用率

命令:lsps -s (或lsps -a)

注意:使用率不要超过70%,如果超过了,要考虑增加交换区或增加内存

查看内存大小的命令:lsattr -El mem0

5.网络检查

命令:netstat -i

作用:查看网卡状态

关注:lerrs/lpkts和Oerrs/Opkts是否>1%

Oerrs:从这个网卡发出去错误包数目的统计

Opkts:从这个网卡发出去的ip包个数的统计

查看路由表

命令:netstat -rn

核对主机名

命令:hostname

查看IP地址

命令:ifconfig -a

用法

ifconfig en0 inet 11.0.0.1 up

ifconfig en0 ns 110:02.60.8c.2c.a4.98 up

查看网卡情况

命令:lsattr El ent0

添加缺省路由

路由信息格式:net,,0,172.16.23.81

命令:chdev -l inet0 -a route=0,172.16.23.81

其中172.16.23.81是网关

删除缺省路由

命令:chdev -l inet0 -a delroute=net,,0,133.16.23.81

如果缺省路由不正确,则先删除,再添加

6.系统故障记录

errdemon进程随系统启动而启动,记录包括硬件、软件及其他操作信息

文件路径:/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析

修改错误日志存放文件:/usr/lib/errdemon -i /PATH/TO/FILENAME

修改错误日志大小:/usr/lib/errdemon -s logsize

修改内存缓冲区大小:/usr/lib/errdemon -B buffersize

列出简短错误信息

命令:errpt | more

TIMESTAMP:MMDDHHMMYY(月日时分年)

T(类型):P 永久 T 临时   U 未知

C(分类):H 硬件 S 软件   O 用户 U未知

列出所有硬件出错信息:errpt -d H

列出所有软件出错信息:errpt -d S

列出详细出错信息:errpt -aj ERROR_ID(或errpt -A -j ERROR_ID)

二、清除错误日志

1.清除10天以前的所有日志

命令:errclear 10

2.清除所有硬件的错误

命令:errclear -d H 0

3.删除所有资源组为disk的记录

命令:errclear -N disk 0

4.删除所有类型为unknown的记录

命令:errclear -T UNKN 0

5.删除所有记录

命令:errclear 0

三、常用操作

1.查看机器上有几条内存及容量

命令:lscfg -vp | grep Size

命令:lscfg -vp | grep DIMM | wc -l

P570上每个Processor Card上有8个DDR memory DIMM slots,所以可以通过lscfg -vp | grep Processor看有几个Processor Card

命令:lscfg -vp | grep Processor

lscfg -vp | grep -p memory

2.查看每个硬盘(PV)容量的方法

命令:Bootinfo -s hdisk*

3.查看HBA卡的产品数据(VPD)信息

命令:lscfg -vl fcs0

四、故障处理

1.使用errpt查看报错信息

2.查看控制面板上的LES代码

8位代码:通常系统故障灯会同时亮起。某些机型还会同时显示故障设备位置代码。(注:S85正常启动过程中有合法的8位代码)

4位代码:通常是Exxx

3位代码:通常为0yyy,只看后3位

8为和4位代码可查看系统服务手册(Service Guide)

3位代码可查看系统诊断手册(Diagnostic Information for Multiple Bus System)

3.查看磁盘可用状态

命令:lsdev -Cc disk

4.查看物理卷

命令:lspv

5.查看卷组

命令:lsvg vg_name

lsvg -l vg_name

lsvg -p vg_name

5.查看文件组信息

命令:lslpp

例:lslpp -L | grep 23100020

6.查看设备参数设置

命令:lsattr

例:查看网卡参数

lsattr -El ent2

7.查看VPD信息

命令:lscfg

例:lscfg -vl ssa1

时间: 2024-10-23 10:36:46

AIX常规检查与排错的相关文章

企业规范化管理之工作检查

常常有企业管理人员问笔者这样的问题:规范化管理的企业要不要工作检查?如果员工遵守制度.标准.流程,执行计划,再去检查是不是增加了管理成本?不去检查又会怎样? 回答显然是肯定的:必须检查!计划执行好坏,必须进行检查:员工绩效高低,必须进行检查.总结员工工作经验,发现计划.政策失误,也必须进行检查.再者,不进行检查,对员工的奖惩就没有依据.因此,管理再规范的企业也需要进行工作检查. 检查是管理的必要手段,只不过规范化管理的企业检查也讲规范,重内容轻形式,而且检查频率低.检查效果好. 那么,笔者今天就

普及下病毒性感冒和细菌性感冒的区别(如何看血常规)

普及下病毒性感冒和细菌性感冒的区别(如何看血常规) http://szbbs.sznews.com/thread-2945245-1-1.html 细菌性感冒    细菌性感冒具有与病毒性感冒不同的特点.    病因不同    细菌性感冒,顾名思义,就是由细菌引起的感冒.引起细菌性感冒的细菌主要有溶血性链球菌.肺炎球菌.流感嗜血杆菌等.    症状不同    细菌性感冒起病可急可缓,而且全身症状相对病毒性感冒轻,上呼吸道症状(打喷嚏.鼻塞.流鼻涕.咽干.咳嗽.声音嘶哑等)通常不明显,但扁桃体或咽

RAID重组和数据库数据的修复与验证

背景介绍: IBM DS5020 光纤存储.存储上一共16块FC硬盘,单盘容量600G.存储前面板10号和13号硬盘亮***故障灯,存储映射到redhat上的卷挂载不上,业务崩溃. 开始工作: 通过IBM storage manager连接到存储查看当前存储状态,存储报告逻辑卷状态失败,再查看物理磁盘状态,发现6号盘报告"警告",10号和13号盘报告"失败",通过IBM storage manager将当前存储的完整日志状态备份下来,解析备份出来的存储日志获得了关于

宏定义与内联函数

1.宏定义的规则和使用解析(1)宏定义的解析规则就是:在预处理阶段由预处理器进行替换,这个替换是原封不动的替换.(2)宏定义替换会递归进行,直到替换出来的值本身不再是一个宏为止.(3)一个正确的宏定义式子本身分为3部分:第一部分是#dedine ,第二部分是宏名 ,剩下的所有为第三部分.(4)宏可以带参数,称为带参宏.带参宏的使用和带参函数非常像,但是使用上有一些差异.在定义带参宏时,每一个参数在宏体中引用时都必须加括号,最后整体再加括号,括号缺一不可. 宏定义示例1:MAX宏,求2个数中较大的

Java 读取Excel格式xls、xlsx数据工具类

需要POI的jar包支持 调用方式: ReadExcelTest excelTest = new ReadExcelTest(); excelTest.readExcel("D:\\data1.xlsx"); package com.util; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; imp

应用SVN(CentOS中搭建SVN服务器)

简单介绍如何在虚拟机 CentOS 中,搭建 SVN 服务器. 软件版本信息 Vmware 10.0.0 build-1295980 CentOS 7.0-1406-x64 Java 1.7.0_67_x64 Suberverson 1.7.14 GNU Wget 1.14 软件安装 subversion yum install subversion 需要选择时,选第一个选项 Wget 用于下载 Java wget --no-cookies --no-check-certificate --he

redhat6.3上安装oracle10g遇到的问题

版本描述: 操作系统版本:redhat6.3  x64 oracle版本:10.2.0.1 经验之谈: 今天在这个版本匹配中,遇到一些问题.主要是包缺失造成的,再次总结一下. 如果要在redhat6 64位平台上安装oracle10g. 你在常规检查的包之外,还需要安装以下包的32位版本(默认这些包的64位版本已经安装过了). 对,这就是奇特的地方,你在64位操作系统上安装64位软件的时候,还必须安装一些32位的包. 这些包有 libXp libXt libXtst glibc-devel 后面

最新的十亿美元级“独角兽公司”都是怎样的? 美国69家成榜首

最新的十亿美元级"独角兽公司"都是怎样的? 美国69家成榜首 0 2015-08-25 09:53· 商业周刊中文版 覃超  阅读:1593 摘要先从国家上来看:1. 美国:69家:2. 亚洲:25 家(大部分来自中国):3. 欧洲:8家 (老大:Spotify 音乐软件):4. 其他:以色列 一家:IronSource (广告业务). unicorn,独角兽公司,是指那些估值达到10亿美元以上的初创企业.跻身"独角兽俱乐部",是所有创业者的梦想.本文作者是Face

浅谈网站为什么还需要检查和监控?

我们通常认为,攻击不存在会不会发生的问题,只存在何时发生,如何发生的问题.针对攻击事件,通过技术平台,尽早发现攻击,减少攻击造成的损失.才会使我们在面对攻击时能够做到工作有条不紊,及时有效应对.过去,安全事件响应的时间往往是在攻击已经发生后较长时间,通过外部扩散造成负面影响后,才得到修复,造成的影响已无法挽回. 一,部署安全设备的政府网站为什么还需要检查 因为网站大检查常态化趋势,监管部门监测任务日趋繁琐.一方面是因为网络安全的形式日益严峻,网站所面临的攻击越来越多,而且互联网服务平台也越来越多