Zabbix简单故障自愈

需求背景

监控指标超过阈值后发出告警,大部分告警可通过触发脚本去自动处理,可一定程度上减低人肉运维的辛苦繁琐。例如某个服务down了、硬盘空间不足等等。

zabbix配置

本例是检查某项服务(主要是端口)down了,在一定时间内未响应或者恢复,直接重启此服务。

  • 登录上zabbix后台

    配置监控项目–>触发器(并关联监控项)–>图形(可查看状态)

  • 在对应的主机里创建监控项目
    mark

  • 创建触发器
    mark

  • 添加图形
    mark

  • 创建动作
    mark

  • 编辑操作
    mark
    操作细节:如果执行的命令需要sudo权限,一定要在前面加sudo

mark

服务器上配置

  • visudo,添加zabbix相应的权限
    mark
    注释visudo中的Defaults requiretty,因为zabbix执行这命令不是通过tty终端登录执行,所以关闭次设置。

mark

  • 编辑配置文件
1
2
编辑/etc/zabbix/zabbix_agentd.conf
开启EnableRemoteCommands=1,设置完需要重启zabbix_agent服务。

mark

  • 测试
    mark
-------------本文结束感谢您的阅读-------------
原创技术分享,感谢您的支持。