Zabbix 告警篇 —— Zabbix 集成睿象云,实现多通道智能告警通知

  • 一:概述
  • 二:部署
    • 1)注册睿象云账号
    • 2)集成睿象云
    • 3)配置分派策略
    • 4)配置通知策略
    • 5)测试
  • 总结


🔔 本文是《Zabbix 企业级监控系统实战指南:从搭建、可视化到智能告警》系列的第三篇
本系列旨在手把手带领您从零开始,构建一套功能完备的企业级监控系统。

⚠️ 该系列所有涉及的软件包和项目都可以私信博主免费获取

🚀 系列目标:学完本系列,您将掌握 Zabbix + Grafana + 睿象云 CA 这一黄金组合,真正实现 “监控-展示-告警” 的全流程自动化。


一:概述

在实际运维中,邮件告警常常存在接收不及时、容易被忽略的问题。为确保告警能够被第一时间关注,可以将 Prometheus 或 Grafana 与第三方告警平台(如睿象云)集成

通过这种方式,监控系统触发的告警会交由第三方平台进行统一管理,并借助其提供的多种告警媒介(如电话、短信、IM 工具等)进行通知,从而显著提升告警信息的 送达率与及时性


二:部署

1)注册睿象云账号

  1. 点击注册

    睿象云-智能运维管理平台-智能运维系统-自动化运维性能监控平台

    在这里插入图片描述

  2. 登录

    在这里插入图片描述

2)集成睿象云

  1. 点击 CA智能告警平台

    在这里插入图片描述

  2. 选择 Zabbix

    在这里插入图片描述

  3. 填入应用名称,并点击“保存并获取应用key”

    在这里插入图片描述
    在这里插入图片描述

  4. 安装 Agent

    ./cloudalert/bin/install.sh <AppKey>

    # 1. 获取 Zabbix 脚本目录路径
    [root@hadoop102 ~]# cat /etc/zabbix/zabbix_server.conf 
    AlertScriptsPath=/usr/lib/zabbix/alertscripts
    
    # 2. 切换到 Zabbix 脚本目录
    [root@hadoop102 ~]# cd /usr/lib/zabbix/alertscripts
    
    # 3. 获取 Cloud Alert Agent 包
    [root@hadoop102 alertscripts]# wget https://download.aiops.com/ca_agent/zabbix/ca_zabbix_release-4.0.1.tar.gz
    
    # 4. 解压&安装
    [root@hadoop102 alertscripts]# tar -xzvf ca_zabbix_release-4.0.1.tar.gz
    [root@hadoop102 alertscripts]# ./cloudalert/bin/install.sh 51a78efdee594d86a3eb619970c45582
    请输入Zabbix管理地址:http://192.168.2.102/zabbix
    Check connection success!
    请输入Zabbix管理员账号:Admin
    请输入Zabbix管理员密码:  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                     Dload  Upload   Total   Spent    Left  Speed
    100   170    0    70  100   100    583    833 --:--:-- --:--:-- --:--:--   840
    Authentication success!
      % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                     Dload  Upload   Total   Spent    Left  Speed
    100   109    0    42  100    67   1371   2188 --:--:-- --:--:-- --:--:--  2233
    Check api version success!
      % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                     Dload  Upload   Total   Spent    Left  Speed
    100   314    0    57  100   257   1291   5824 --:--:-- --:--:-- --:--:--  5976
    Create new media type success!
      % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                     Dload  Upload   Total   Spent    Left  Speed
    100   192    0    54  100   138   1474   3767 --:--:-- --:--:-- --:--:--  3833
    Create new group success!
      % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                     Dload  Upload   Total   Spent    Left  Speed
    100   398    0    51  100   347    545   3709 --:--:-- --:--:-- --:--:--  3731
    Create new user success!
      % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                     Dload  Upload   Total   Spent    Left  Speed
    100  1652    0    51  100  1601   1040  32666 --:--:-- --:--:-- --:--:-- 33354
    Create new action success!
    Install zabbix agent success!
    
  5. 查看

    在这里插入图片描述

3)配置分派策略

分派策略可以配置,哪些应用的告警信息,发送给哪些用户。例如实时数仓的告警信息发送给张三

  1. 点击 CA智能告警平台

    在这里插入图片描述

  2. 点击分配策略

    在这里插入图片描述

  3. 新建分配策略

    在这里插入图片描述

  4. 配置分配策略

    在这里插入图片描述

    在这里插入图片描述

4)配置通知策略

通知策略,可以配置被分派人接收告警的通知方式,通知时间,通知延时等等。

  1. 点击 CA智能告警平台

    在这里插入图片描述

  2. 点击通知策略

    在这里插入图片描述

  3. 新建通知策略

    在这里插入图片描述

    在这里插入图片描述

    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  4. 禁用 Zabbix 中的 Send_Email 动作
    在这里插入图片描述

  5. 配置 Zabbix 动作

    在这里插入图片描述

    在这里插入图片描述

5)测试

  1. 关闭 HDFS

    [root@hadoop102 hadoop-3.1.3]# ./sbin/stop-dfs.sh 
    
  2. 查看邮箱告警


总结

本篇文章全面介绍了 Zabbix 集成睿象云智能告警平台 的方法与实战应用。通过注册睿象云账号、安装 Agent、配置分派与通知策略,展示了如何实现多渠道告警通知,解决传统邮件告警存在的延时与遗漏问题:

✅ 告警增强:突破 Zabbix 默认邮件告警的局限,支持短信、电话、微信、钉钉、企业微信等多通道推送
✅ 策略灵活:通过分派策略和通知策略,实现按服务、按人员、按时间的精细化告警管理
✅ 自动集成:Agent 脚本自动完成 Media Type、用户、Action 的创建,大幅减少手工配置量
✅ 实战价值:以 HDFS 停止为案例,验证了告警从触发 → 平台分派 → 多通道通知的完整流程

Zabbix 与睿象云的结合,使得企业能够从 “监控-可视化-告警” 三个层面全面提升运维能力,尤其适合需要 高可靠告警、多人协作值守 的生产环境。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐