2025-10-31

凯发k8官网首页基于Zabbix的SLA监控体系|lusirapp软件下载|构建

  本文由Zabbix社区专家褚凤彬分享★ღ,详解SLA在Zabbix中的应用★ღ。通过Trigger与Service联动★ღ,构建Web应用的多层级监控体系★ღ,并介绍SLA计算规则★ღ、维护期处理及升级注意事项★ღ,助力企业精准掌控服务可用性★ღ。

  SLA★ღ,全称是Service Level Agreement, 是用来管理服务的表现★ღ。在Zabbix中我们可以把自己的应用监控起来★ღ,还可以为它建立SLA★ღ。

  在Zabbix中★ღ,SLA的实现★ღ,是建立在Trigger基础上的★ღ。简单地说★ღ,当一个★ღ,或多个相关Trigger触发时★ღ,就会对我们定义的SLA产生影响★ღ,它会自动计算往下跌★ღ。Trigger一旦恢复★ღ,它就停止往下跌★ღ。

  当Trigger触发时凯发k8官网首页★ღ,是通过Trigger里的Tag传送到Service中★ღ。所以我需要给三台Nginx服务器的这个Nginx服务不在运行的Trigger建立不同的Tag★ღ。保证这台主机的Nginx停止时★ღ,会有一个唯一的Tag传送出来★ღ。

  进入左侧Services / Services 菜单★ღ,点进右上角的Edit进入编辑模式★ღ,然后点Create service新建一个Service★ღ,命名为“某Web应用“★ღ,先不要理会它的属性页面★ღ。如下图★ღ:

  在这里我们注意的是★ღ,我们需要在Problem tags里★ღ,把第一步中★ღ,为Trigger建立的Tag名字和值填进去★ღ。注意我现在用的值是Web4_也就是宏在触发时会解析成Web4★ღ。

  至此lusirapp软件下载★ღ,一个简单的“某Web应用“的Service已经建好★ღ。你会发现它就是一个简单的Parent/Child关系lusirapp软件下载★ღ。Parent就是我们要关注的SLAlusirapp软件下载lusirapp软件下载★ღ,而它是受下面一个lusirapp软件下载★ღ,或者多个不同Child组合的影响凯发k8官网首页★ღ。

  这里有一个Service tags★ღ,就是在第三步提醒您留意的★ღ,在parent service中的tag页面里自定义的一个tag★ღ。两者需要名字和值都完全相同★ღ。

  到现在★ღ,我们可以看到★ღ,SLA就是利用Trigger触发时间的多少★ღ,来影响我们自定义的SLA★ღ。

  如果碰上系统★ღ、应用★ღ、电力等因素而不得不导致SLA受影响凯发k8官网首页★ღ,但我们允许Zabbix里的SLA保持不变★ღ,可以按下面两个方法之一来设置:

  (1) 到Services / SLA菜单★ღ,点击那个我们不想发生影响的SLA★ღ,点击Excluded downtimes页面★ღ,把维护的时间填进去★ღ。这样的话★ღ,在这段时间里★ღ,无论发生什么情况★ღ,SLA会保持不变lusirapp软件下载凯发k8官网首页★ღ。如下图★ღ:

  (2)给受影响的主机★ღ,制定维护计划★ღ,在某段时间里★ღ,报警压制★ღ,SLA也不受影响了★ღ。这个方法简单★ღ,但在7.0之前似乎还不支持★ღ。

  (1)请注意Tag的名字和值★ღ,一定要区分大小写★ღ。在给模板Trigger新建Tag时★ღ,要有一个自己的规划凯发k8官网首页★ღ,触发的时候Tag都是唯一的才可以方便地管理SLA★ღ。

  (2)不要在SLA计算发生时★ღ,尝试通过去修改SLA定义★ღ,让它停下来★ღ。我在线下Meetup交流时★ღ,有人说可以在修改条件后尝试重启一下Zabbix 服务★ღ,这个有机会还是测一下★ღ。

  (3)在大版本升级时★ღ,做好SLA的备份★ღ。Zabbix在这方面还没有做好★ღ,但你要是从5.0升级到6.0★ღ,看看下面的痛点★ღ。

  绝大部分的SLA确实转换成功的★ღ,但我也发现有2★ღ、3个转换错了★ღ,好多SLA都无法阅读★ღ,而且按我的理解可能一个Trigger引发两个SLA变动lusirapp软件下载★ღ,甚至没有一个SLA会受影响lusirapp软件下载★ღ。我在6.0升级到7.0时★ღ,没有发现有问题★ღ,原样升上来了★ღ。凯发一触即发★ღ,K8凯发(中国)天生赢家·一触即发★ღ,凯发k8一触即发★ღ,凯发,凯发k8,K8★ღ,凯发k8官方★ღ。一触即发k8凯发国际登录★ღ,自动化进程★ღ,