观测云4月产品升级报告 | 统一目录、Obsy AI 全新上线,基础设施、场景、监控告警、管理多项能力升级
2026 年 4 月,我们收到不少用户反馈。我们把这些声音,一条条变成了产品更新,以下是本月最值得关注的 7 大升级亮点,每一个都为了让你的观测体验更顺滑、更贴合实际业务场景。
2026 年 4 月,我们收到不少用户反馈。我们把这些声音,一条条变成了产品更新,以下是本月最值得关注的 7 大升级亮点,每一个都为了让你的观测体验更顺滑、更贴合实际业务场景。
01|重磅上线!统一目录,全栈资产集中可视、拓扑架构自动生成
需求背景
有客户反馈随着上云规模持续扩张,业务横跨多账户、多区域、多云厂商,主机、数据库、业务服务、云资源资产数量庞大且分散割裂。运维人员没有统一资产总览入口,只能零散查看各类资源;不清楚全局架构布局,也看不清资源之间调用依赖、层级从属关系。一旦出现业务故障,无法快速定位关联资产和影响范围,只能人工逐个排查链路,排耗时长、运维成本高,亟需一套可自动纳管、全景可视、关系可追溯的统一资产目录。
更新说明
针对企业跨云、跨区域资产分散难管控、架构不透明、依赖难追溯的问题,统一目录模块正式上线,实现全栈资产自动发现、集中纳管、关系洞察与全景拓扑可视化:
- 全资产统一纳管:预置系统、服务、主机、数据库、云资源 5 大实体类型,支持自定义扩展;提供自动发现、DataKit 上报、云资产采集、YAML 声明四种接入方式,全覆盖纳管场景
- 实体关系可视化:侧滑页展示元数据、联系人、外部链接;提供依赖视图、层级视图双拓扑模式,可按需查看调用包含关系或纯层级关系,支持一级 / 全路径深度自由切换
- 全景架构自动拓扑:自动生成工作空间整体架构图,支持多维度筛选、最多 5 层嵌套分组及视图保存,快速掌握全局架构与依赖链路
- 关联视图智能配置:实体类型匹配官方内置视图时自动默认启用,支持按需开关,降低配置成本
- 开放自动化能力:提供实体 / 实体类型全量 Open API,支持创建、编辑、删除、导出、列表查询,无缝对接自动化运维脚本,适配批量运维场景
如何体验
进入「统一目录」,自动纳管全栈资产,随时查看全景架构拓扑与实体依赖关系。
- 实体列表

- 全景拓扑图

- 依赖关系

02|Obsy AI 全局升级,右侧抽屉式、自然语言生成仪表板
需求背景
在日常工作中,运维人员在告警排查、指标分析、链路诊断等业务场景下,无法快速唤起 AI 辅助分析;同时业务人员不懂查询语法、不会配置仪表板,想要快速制作业务指标看板只能依赖研发协助,门槛高、落地慢,迫切需要全场景统一 AI 入口 + 自然语言自动生成图表的能力。
更新说明
为解决不同场景唤起不便、普通用户难以自制仪表板的问题,Obsy AI 完成平台级全局重构,升级右侧抽屉式统一交互入口:
- 全场景全覆盖:整合自然语言问答、故障根因分析、业务指标解读、链路异常诊断等能力,一处入口、全场景可用,彻底解决 AI 入口零散、使用门槛高的痛点
- 全页面上下文联动:在错误日志、告警、仪表板、故障链路、RUM Error 等场景唤起 AI,自动带入当前页面上下文,匹配场景化快捷分析模板,一键智能解析数据、定位问题
- 自然语言生成仪表板:支持通过文字描述业务需求,自动生成仪表板草案,可在线修改、预览、保存并标识 AI 生成来源,同时支持列表筛选管理,零门槛制作业务看板
如何体验
平台任意页面点击右上角 Obsy AI 图标,或在详情页直接唤起 Obsy AI,自然语言交互即可完成分析与图表生成。
- 故障根因分析

- 错误链路分析

- 自然语言生成 DQL 语句

- 自然语言生成仪表板

- 文档查询

03|基础设施深度增强:数据库性能分析、网络流一键跳转
需求背景
有客户反馈,运维日常巡检数据库时,只能看到基础实例状态,缺少负载趋势、SQL 耗时、会话阻塞、资源利用率等核心观测指标,一旦出现数据库卡顿、响应变慢,无法快速判断根因是慢 SQL 还是会话死锁。同时排查网络链路问题时,在网络详情页看到异常后,还要手动复制筛选条件、再到网络流页面重新配置,操作繁琐、链路不连贯,影响排障效率。
更新说明
围绕数据库巡检缺指标、故障难定位,以及网络排查操作繁琐的问题,对基础设施数据库和网络能力升级:
- 增强数据库深度分析能力:PostgreSQL、MySQL 数据库详情页新增查询、会话标签页,直观呈现 SQL 性能耗时、会话连接状态与阻塞链路,快速区分慢 SQL、会话死锁等故障根因
- 重构数据库概览视图:拓展属性独立为标签页;新增查询耗时 / 执行次数趋势、等待状态分布、负载趋势及 CPU / 内存 / 磁盘 IO / 网络 IO 等关键指标,满足日常巡检需求
- 优化网络链路排查体验:网络流详情页新增直达网络流页面快捷入口,自动带入当前筛选条件,无需手动复制重配,实现异常定位到明细下钻一键直达,提升排障效率
如何体验
1、进入「基础设施」-「数据库」,在数据库列表点击进入 PostgreSQL、MySQL 详情页,即可查看。
- 概览

- 查询

- 会话

2、进入「基础设施」-「网络」,查看下钻分析。

04|视图变量多项体验升级:变量值筛选优化、外部分享可控
需求背景
有客户反馈,企业按项目、团队共用的仪表板中,当使用数据库 SQL 查询时,配置的服务变量值检索时不生效,无法进行筛选;多选变量筛选后,需额外点击空白区域才能触发查询,操作流程不连贯,影响使用效率;对外分享仪表板给业务方或合作方时,对方可随意改动视图变量和时间范围,缺乏必要的控制与保护机制。
更新说明
围绕仪表板查询与分享,视图变量多项体验升级:
- 修复外部数据库 SQL 查询的变量检索问题:支持在仪表板中正常使用数据库 SQL 查询,配置的服务变量值可被正确检索与筛选,解决之前筛选失效的问题。
- 优化多选变量触发逻辑,操作更流畅:多选变量下拉框中新增 “应用” 按钮,支持一键执行查询,无需再点击空白区域触发。
- 增强仪表板外部分享的控制能力:对外分享仪表板时,支持锁定视图变量(被分享者不可修改),同时时间范围可设置为绝对时间,有效避免业务方或合作方随意改动视图。
- 新增视图变量可用性监测来源:视图变量来源新增 API 拨测 / 多步拨测,进一步提升变量取值范围。
如何体验
- 进入「场景」,选择需要查询的「仪表板」,在配置的「视图变量」,选择需要筛选的变量值,点击「应用」。

- 进入「场景」,选择需要分享的「仪表板」,点击右上角「分享」,关闭“允许查看者更改时间范围”,开启“固定视图变量”。

- 进入「场景」,创建或选择需要配置的「仪表板」,点击「添加视图变量」,在「查询」选择数据源「可用性监测」。

05|监控告警与通知全面升级:集成 Telegram 通知、高基数防护、排查与配置效率提升
有客户反馈,随着全球使用场景增加,Telegram 已成为团队的重要通知渠道,当前系统缺少原生 Telegram 通知能力,团队需自建中转服务实现告警推送,存在成本高、稳定性差的问题。同时,业务接口与链路追踪中存在 traceid、uuid 等高基数字段,配置监控聚合后会生成海量分组,爆发大量告警,造成告警轰炸、淹没有效告警,占用平台资源。另外,团队在排查前端、应用错误时,希望能在错误中心快速配置过滤规则,但缺少快捷入口。
更新说明
基于海外通知渠道缺失、错误中心规则配置、告警爆炸等问题,监控告警与通知多维强化:
- 新增国际化通知渠道:国际 / 香港站点原生支持 Telegram Bot 通知对象,适配私聊、群组、频道多场景,告别自建中转服务,降低成本、提升稳定性
- 错误中心查看器新增新建规则快捷入口:支持日志 / APM / RUM 全类型过滤条件,可快速屏蔽无用错误、精准圈定生效范围
- 新增告警缓存防护机制:当检测对象数量达到预警阈值时触发系统通知(每日最多 1 次)、达到上限时自动暂停监控器并发送系统通知,避免告警轰炸与资源占用;同步优化未恢复告警存储周期由 30 天调整系统为 7 天,合理管控数据体量
如何体验
- 进入「监控」-「通知对象管理」,点击「新建通知对象」,选择 Telegram Bot 通知对象。

- 进入「错误中心」,点击右上角「新建规则」,即可选择过滤 日志 / APM / RUM 。


06|Pipeline 通配符过滤,支持灵活筛选数据来源
需求背景
有客户反馈,在配置 Pipeline 时,面对日志、APM、RUM 等数据源,只能逐个选择或配置为默认,不支持更灵活的匹配方式,希望能支持数据源基于正则表达式的条件匹配方式。
更新说明
为解决 Pipeline 数据源匹配方式单一,升级数据处理过滤能力:
- Pipeline 规则配置过滤条件新增通配符匹配能力,支持
*匹配任意字符、?匹配单个字符,可批量模糊筛选日志、APM、RUM 及自定义全类型数据源。规整命名的服务、日志路径可通过一条通配符规则批量适配,无需逐个新增配置,大幅简化规则维护. - 版本要求:商业版需将 DataKit 升级至 1.93.0 及以上,本地 Pipeline 才会生效(中心 Pipeline 的配置不受 DataKit 版本影响);部署版需将中心 Pipeline 更新至 1.129.224 及以上。
如何体验
进入「管理」-「Pipeline」,点击「新建 Pipeline」进行配置。

07|管理能力全面增强:自动化角色配置、LLM 数据转发、配置迁移与安全合规
需求背景
有客户反馈:
- 通过 OpenAPI 批量创建空间、邀请成员、配置角色时,设置管理员需人工在费用中心审核,无法实现全流程无人值守自动化。
- 在使用 LLM 大模型观测时,需要把 LLM 观测数据同步转发,现有转发能力不支持该类数据类型。
- 在从旧环境、其他平台迁移至观测云专属版时,大量监控视图、数据处理规则、权限配置无法批量迁移,只能手动重建,工作量大且容易出错。
- 为了保障账号与数据访问安全,希望有更细粒度的个人密钥和 Token 轮换机制
- 为了避免敏感数据即时泄露,希望为新写入日志设置窗口期延迟可见
更新说明
针对自动化运维卡点、LLM 数据转发缺失、配置迁移繁琐、数据合规与权限管控不足等问题,管理能力全面增强:
- 打通管理员自动化配置链路:邀请入口及 OpenAPI 可直接设置成员为管理员角色,权限变更即时生效,无需人工审核,真正实现脚本全流程自动化运维
- 扩容数据转发能力:新增 LLM 类型数据来源同步,满足大模型观测数据流转需求;支持自定义 Endpoint
- 升级全量配置迁移能力:支持工作空间监控视图、告警策略、数据处理规则、角色权限、数据合规等核心资源一键导入导出,大幅降低环境迁移、版本切换的手动配置成本
- 强化企业安全合规管控:支持工作空间 Token 自主轮换并自动邮件通知负责人;新增细粒度个人 API 密钥,权限隔离更安全
- 新增日志延迟可见能力:空间高级设置新增专属开关,可统一配置日志查询延迟窗口,窗口期内新写入日志对全员不可见,满足敏感数据安全要求
如何体验
- 进入「管理」-「空间设置」即可进行配置迁移、更换 Token、设置日志延迟可见等操作。

- 进入「管理」-「成员管理」,设置成员为管理员角色,或者直接通过 OpenAPI 接口操作。

- 进入「管理」-「数据转发」,在新建规则时选择「LLM」。

- 点击右上角账号,在下拉菜单中即可查看「个人 API 密钥」。

08|更多体验优化与问题修复
LLM 监测查看器优化
- 支持绑定内置视图,新增步骤级 Token 消耗统计,属性搜索可跨 Span 同步检索,满足大模型精细化观测需求。


仪表板与图表能力全面优化
- 仪表板分组增强:支持自定义分组默认展开 / 收起状态,页面管理更规整
- 生态兼容升级:支持一键导入 Grafana 仪表板,存量看板快速迁移复用
- 直方图组件适配:全支持 PromQL 查询,兼容 Prometheus 生态查询语句
- 图表外部数据源智能适配:查询语句支持
#{step}作为interval占位符,替代固定时间间隔值;系统根据当前时间范围自动计算并传入最优间隔值(单位:秒),实现数据展示精度随查询范围动态优化;无需手动调整函数参数,系统自动平衡大数据量场景下的查询性能与图表展示效果
跨空间查询能力升级
支持 APM、RUM 核心界面跨空间查询,适配多团队、多空间协作查看需求
配置导入体验优化
导入冲突支持按组处理,区分三类冲突(标识 ID+ 名称同时冲突、仅标识 ID、仅名称),覆盖仪表板及工作空间迁移;同步优化导入结果弹窗提示,冲突原因与处理结果一目了然。
查看器大数据采样防护
新增大数据量查询保护机制,当查询数据量超过系统阈值时自动触发强制采样,规避海量数据加载卡顿、资源占用过高等问题,保障平台稳定运行。
工单管理体验升级
工单提交及评论回复附件,新增支持 .mov、.mp4 视频格式上传,便于故障、日志等视频提交、留存。
全新开放 OpenAPI 能力
- LLM 应用:开放全生命周期管理接口,支持新建、编辑、删除、列表查询,适配自研与自动化集成
- 统一目录:开放实体及实体类型全量管理接口,涵盖创建、编辑、删除、导出、列表能力,赋能资产自动化运维
部署版专属能力增强
管理后台工作空间索引配置,面向 OpenSearch/ES 存储新增 resource_map 数据类型,支持自定义主分片数量,灵活适配不同业务数据量级规划(仅对新建索引生效)。
更多更新详见观测云四月更新日志:https://docs.guance.com/release-notes/
每一次更新,都为了让观测更简单、更强大。每一项看似微小的体验改进,都源于我们对真实用户使用场景的深刻洞察。观测云以极微之行致广大之境 ,致力于让可观测性不仅是技术能力的堆砌,更是如丝般顺滑的操作体验。
如果您有任何功能建议或使用反馈,欢迎立即联系我们小助手/访问官网联系我们 — 您提需求,我们改产品,让观测云成为最懂你的可观测平台。
下月见,愿你的系统稳如磐石,查询疾如闪电!
更多推荐


所有评论(0)