文档介绍:RS6000的日常管理和故障的处理
RS6000 Admin & PD
RS6000 Admin & PD
日常管理
故障的处理
IBM 服务热线 8008101818(6677)
内容提要
系统健康检查
查看硬件情况
检查设备故障灯,一般为橙色并有标志。
有没有异常声响,如硬盘、风扇等。
有没有破损的电缆等
查看系统故障信息
用errpt命令查看系统出错信息。
用mail命令查看有否发给root用户的错误报告。
查看其他的记录文件,如/tmp/。
检查文件系统
查看有没有“满”的文件系统。文件系统满可导致系统不能正常工作,尤其是AIX的基本文件系统。如/ (根文件系统)满则会导致用户不能登录。
日常管理
系统健康检查
# df -k (查看AIX的基本文件系统)
Filesystem 1024-blocks Free %Used Iused %Iused Mounted on
/dev/hd4 24576 1452 95% 2599 22% /
/dev/hd2 614400 28068 96% 22967 15% /usr
/dev/hd9var 8192 4540 45% 649 32% /var
/dev/hd3 167936 157968 6% 89 1% /tmp
/dev/hd1 16384 5332 68% 1402 35% /home
日常管理
除/usr文件系统,其他文件系统都不应太满,一般不超过80%。
处理方法1:删除垃圾文件
# du -sk * |sort -rn |head
查找出当前目录下占空间最大的子目录,逐层往下直到找出占空间最大的文件。(要区分哪些目录是文件系统的 mount point,哪些是文件系统的子目录)删除文件,释放空间。有时删除文件后空间并不马上释放,这是由于你删除的文件正被某个程序打开。只有当这个程序停止后空间才释放,有时甚至需要重起系统。
系统健康检查
处理方法2:增加文件系统大小
# smitty chjfs
文件系统可以在任何时候加大,前提是卷组(VG)中有剩余空间。
检查文件系统的完整性
# umount filesystem_name
# fsck -y filesystem_name
注意:文件系统必须先umount,再做检查和修复,否则可导致未
知的后果。
日常管理
系统健康检查
日常管理
查看卷组信息
lsvg -l vg_name
有没有"stale"状态的逻辑卷。
用syncvg 命令修复。
检查内存交换区(paging space)使用率
lsps -s
使用率不要超过70%。
增加交换区,或增加内存。
检查进程:lssrc -a /ps -ef
系统健康检查
日常管理
stat -i 查看网卡状态
Ierrs/Ipkts 和 Oerrs/Opkts是否>1%
ping host_name /IP Address
查看是否通和是否有丢包。
路由表
#netstat -rn
查看路由表是否正确,ping 各路由器是否通。
主机名
#hostname
备份
日常管理
系统备份(mksysb)
除每日进行正常的用户数据备份外,建议定期进行系统备份。
备份前先停止业务系统软件和HACMP 软件的运行。签退其他无关的用户,停止其他无关的操作。
系统备份只备份 ROOTVG,除系统基本的5个文件系统外,其他 ROOTVG上已 mount 上的文件系统也会被备份。
用 smittty mksysb 命令进行系统备份,备份前先清掉root的密码。
每当系统作变更(安装新软件、补丁程序等)前后,都需要做系统备份。
Back Up the System
Type or select values in entry fields.
Press Enter AFTER making all desired changes.
[TOP] [Entry Fields]
WARNING: Execution of the mand will
result in the loss of all material
previously stored on the selected
output medium. mand backs
up only rootvg volume group.
* Backup DEVICE or FILE [/dev/rmt0] +/
Create MAP files? no +
EXCLUDE files? no +
List files as they are backed up? no +
Generate new /image.