shell脚本-监控系统资源并通过短信报警

公司采用nagios监控,通过nagios client将需要的数据收集并传给nagios服务器,目前所遇到的问题是我们公司部分机器是再其他机房,例如:东航,是不允许安装客户端并访问外网的,为了更好的检测服务器状态,遇到问题可以发短信和邮件的方式通知运维人员进行处理,与开发人员协商开放了短信、邮件两个接口,通过脚本的方式将监控服务器状态,遇到故障后通过脚本方式发送报警。

目标分析:

所需的监控资源:

1、登陆用户数

2、CPU负载

3、服务探测

4、硬盘空间(根分区、应用分区、备份分区)

5、内存资源

短信接口、邮件接口

格式上传至附件

脚本:

#!/bin/bash#监控用户登录Usermonitor () {LoginUser=`uptime | awk ‘{print $6}’`if [ $LoginUser -ge 2 ]thenCritical=”当前系统登录用户人数超过1人,虚拟主机,具体人数为:$LoginUser 个,请确认操作者人数。”status=0elseecho “loginuser ok”status=1fi}#监控内存MemMonitor () {MemTotal=`free -m | grep Mem | awk -F: ‘{print $2}’ | awk ‘{print $1}’`MemFree=`free -m | grep cache | awk NR==2 | awk ‘{print $4}’`MemFreeB=`awk ‘BEGIN{printf “%.2f%\n”,’$MemFree/$MemTotal\*100’}’`MemFreeS=`awk ‘BEGIN{printf “%.f”,’$MemFree/$MemTotal\*100’}’`if [ $MemFreeS -lt 10 ]thenCritical=”系统可用内存小于10%,实际可用内存为:$MemFreeB ,请处理。”status=0elif [ $MemFreeS -lt 20 ]thenWarning=”系统可用内存小于20%,实际可用内存为:$MemFreeB ,请查看。”WarningT=”内存报警”status=1elseecho “Mem OK”status=2fi}#监控分区空间大小DiskMonitorG () {#根分区DiskGB=`df -h | awk NR==2 | awk ‘{print $5}’`DiskGS=`df -h | awk NR==2 | awk ‘{print $5}’ | awk -F% ‘{print $1}’`if [ $DiskGS -gt 90 ]thenCritical=”根分区使用率超过90%,实际已使用 $DiskGB ,请处理。”status=0elif [ $DiskGS -gt 80 -a $DiskGS -lt 90 ]thenWarning=”根分区使用率超过80%,实际已使用 $DiskGB , 请查看。”WarningT=”根分区报警”status=1elseecho “DiskGB Ok”status=2fi}DiskMonitorA () {#应用分区ApplyB=`df -h | awk NR==4 | awk ‘{print $5}’`ApplyS=`df -h | awk NR==4 | awk ‘{print $5}’ | awk -F% ‘{print $1}’`if [ $ApplyS -gt 90 ]thenCritical=”应用分区使用率超过90%,实际已使用 $ApplyB ,请处理.”status=0elif [ $ApplyS -gt 80 -a $ApplyS -lt 90 ]thenWarning=”应用分区使用率超过80%,香港服务器租用,实际已使用 $ApplyB ,请查看。”WarningT=”应用分区报警”status=1elseecho “Apply ok”status=2fi}#监控CPU负载CPULoad () {CPULoad1=`uptime | awk ‘{print $10}’ | awk -F. ‘{print $1}’`CPULoad2=`uptime`if [ $CPULoad1 -gt 5 ]thenCritical=”CPU负载过高,请即使处理。 $CPULoad2 “status=0elif [ $CPULoad1 -gt 3 -a $CPULoad1 -lt 5 ]thenWarning=”CPU负载警告,美国服务器, $Warning “WarningT=”CPU负载报警”status=1elseecho “CPU OK”status=2fi}#监控服务状态ServerMonitor () {#服务状态监控timeout=10makfails=2fails=0success=0while truedo/usr/bin/wget –timeout=$timeout –tries=1 -q -O /dev/nullif [ $? -ne 0 ]thenlet fails=fails+1success=0elsefails=0let success=1fiif [ $success -ge 1 ]thenexit 0fiif [ $fails -ge 1 ]thenCritical=”TMS应用服务出现故障,请紧急处理!”echo $Critical | mutt -s “服务down” hao.lulu@chinaebi.comexit -1fidone}#发送报警短信、报警邮件for n in Usermonitor MemMonitor DiskMonitorG DiskMonitorA CPULoad ServerMonitordo$nif [ $status -eq 0 ]thencurl “http://172.20.36.118/app/tms.do?tranCode=TM0311&content=$Critical”elif [ $status -eq 1 ]thencurl “http://172.20.36.118/app/tms.do?tranCode=TM0310&title=$WarningT&content=Warning”elseecho “ok”fidone

本文出自 “折翅飞翔的小鸟” 博客,请务必保留此出处

也会让你心无旁骛,更会让你的心灵得到解脱和抚慰。

shell脚本-监控系统资源并通过短信报警

相关文章:

你感兴趣的文章:

标签云: