需求背景
监控指标超过阈值后发出告警,大部分告警可通过触发脚本去自动处理,可一定程度上减低人肉运维的辛苦繁琐。例如某个服务down了、硬盘空间不足等等。
zabbix配置
本例是检查某项服务(主要是端口)down了,在一定时间内未响应或者恢复,直接重启此服务。
登录上zabbix后台
配置监控项目–>触发器(并关联监控项)–>图形(可查看状态)
在对应的主机里创建监控项目
创建触发器
添加图形
创建动作
编辑操作
操作细节:如果执行的命令需要sudo权限,一定要在前面加sudo
服务器上配置
- visudo,添加zabbix相应的权限
注释visudo中的Defaults requiretty,因为zabbix执行这命令不是通过tty终端登录执行,所以关闭次设置。
- 编辑配置文件
1 | 编辑/etc/zabbix/zabbix_agentd.conf |
- 测试