zabbix使用IT services 了解服务器SLA整体情况(60)

凉白开 zabbix227,3535字数 2697阅读8分59秒阅读模式

什么是IT Services

服务器或者某项服务、业务的可用率,不懂技术的上级领导会过问最近服务器可用率如何、所有api的状况怎么样?通常一些技术人员会说负载怎么样,哪些cpu使用率怎么样,硬盘使用情况,api的响应速度都保持在多少、响应时间都在多少?还没等说完,领导就打断了。他不关心这些细节,更不懂这些技术。他想要的是一个结果。比如说服务器故障率在0.001,api的响应率在99.99%。这就是IT Services的功能。

IT service结构如下:文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

IT Service
|
|-Workstations
| |
| |-Workstation1
| |
| |-Workstation2
|
|-Servers

IT Sverices示例文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

举个例子,API的SLA,各个子Service都有他的可用率,然后XXX网站API可以统计到整个API的可用率,当领导过问起来,给他看这个就行了。文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

IT Service
|
|-XXX网站API
| |
| |-天气API
| |
| |-新闻API
| |
| |-用户API
|
| |-....xxxAPI(省略各种api)
|
|-Servers(其他services)

那这些可用率是怎么计算出来的呢?根据你的触发器,除了未分类和信息这两类,其他严重性级别,例如警告(warnning)等等都会记入故障率文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

 文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

配置IT Services文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

configuration->IT Services->单击root->Add services文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

IT Services

zabbix it service - 创建

创建服务器在线率文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

IT Services

zabbix it services 服务器在线率

service说明文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

name:名称文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

Parent service:上级节点,这边是root文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

Status calculation algorithm:计算付费,共有三个选项文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

  • Do not calculate - 不加入计算
  • Problem, if at least one child has a problem - 子项至少一个发生故障(一般用这个)
  • Problem, if all children have problems - 所有子项都发生故障,才加入计算

Acceptable SLA (in %):可接受的可用率百分比,如果在大于这个百分比那么现实绿色,如果小于那么就是红色显示文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

Trigger:触发器,可以选触发器也可以不选,不过大家要记住,可用率计算的就是这些触发器的可用率,如果没有触发器根本无法计算。最上级的可以不选触发器,子项一定记得选择触发器,否则就失去意义了。文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

添加子service文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

IT Services

zabbix-it-service-03

IT Services

zabbix-it-service-04

依赖标签文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

这边我们不增加依赖,在后面我们专门来谈谈这个依赖文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

IT Services

zabbix-it-service-05

Time这边如果默认,那么就是24x7文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

IT Services

zabbix-it-service-06

Time说明文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

Service times:定义好的工作时间文章源自运维生存时间-https://www.ttlsa.com/zabbix/zabbix-it-services/

New service time:一共有三个选项

  • Downtime - 在这个时间段,不计入SLA
  • One-time downtime - 在这个时间段,不计入SLA,指定一个时间(只有一次)
  • Uptime :工作时间,在这个时间内出现故障都计入SLA

看看效果,monitoring-->IT services

IT Services

zabbix-it-service-07

IT Services依赖

分为hard和soft依赖,例如我们增加一个C服务器,他需要依赖其他IT树下的services,首先它不能链接触发器,在依赖那边选择其他树下依赖即可,可以添加多个,软依赖是灰色的标识,硬件依赖则是直接把整个service挪过来。如果C服务器使用软依赖,那么可以直接删除C服务器Service,如果是硬依赖,需要先移除依赖,才能删除。

IT Services

service-soft-hard-01

soft不勾选,表示为硬依赖

IT Services

service-soft-hard-02

如下,原本“测试”和“服务器在线率”在同一个层级,都归属于root,但是加了硬依赖之后,直接到了C服务器只下了

IT Services

service-soft-hard-03

接着来看看软依赖

勾选soft,就是软依赖了

IT Services

service-soft-hard-04

看下图,和硬依赖很不相同,C服务器下的测试是灰色的,并且“测试”依旧和“服务器在线率”在同一个层次。

IT Services

service-soft-hard-05

此时你可以直接删除C服务器,但是硬依赖的情况下不行哦。

好了,zabbix IT SERVICES就到这里了,可以给领导开个权限,这样他也可以了解到服务器整体状况了。运维们也需要经常看,毕竟这是调整的一个一句。

学习zabbix的继续关注运维生存时间zabbix教程,后续还有更多相关文章。

weinxin
我的微信
微信公众号
扫一扫关注运维生存时间公众号,获取最新技术文章~
凉白开
  • 本文由 发表于 14/12/2014 01:00:54
  • 转载请务必保留本文链接:https://www.ttlsa.com/zabbix/zabbix-it-services/
评论  2  访客  2
    • houseschan
      houseschan 9

      对WEB不太了解,最近这几节有点难度…

        • ttlsa粉丝
          ttlsa粉丝 9

          @ houseschan 慢慢就会豁然开朗的

      评论已关闭!