生成式AI:热潮真实存在,但局限性也同样存在

如今,85% 的组织在可观测性中使用了某种形式的生成式AI。两年内,这一数字将达到 98%。届时,这将成为任何值得评估的平台的基本门槛。

为何发展如此迅速?可观测性产生的数据规模巨大,人类无法手动处理。在事件发生时关联日志、指标和链路,过去需要工程师对整个系统拓扑结构了如指掌。生成式AI自动化了这种模式识别,并允许团队用自然语言查询遥测数据。

这是其前景所在。现实情况则更为复杂。

团队实际如何实施生成式AI

组织同时采用多种方法,因为没有单一方法能完美处理所有事情。

独立工具(如 ChatGPT 和 Claude)以及内置的平台功能显示出几乎相同的采用率,分别为 53% 和 52%。两者都易于部署,无需定制工作。

随后,发展轨迹出现分歧。

  • 15% 计划增加独立的生成式AI
  • 23% 计划专注于内置功能
  • 两年内,供应商集成的生成式AI采用率将达到 75%

这合乎情理;独立工具缺乏上下文。你可以将日志粘贴到 ChatGPT 中,但它不了解你的服务依赖关系或部署模式。它对于临时分析很有用,但不适用于生产工作流程。供应商集成的解决方案则能在你的数据上运行,且上下文已就绪。

专为可观测性构建的生成式AI和代理式AI需要更多的集成工作。目前的采用率较低,但在那些已超越基础阶段的团队中,兴趣很高。

生成式AI成熟度比预算更重要

早期阶段的团队生成式AI采用率为 71%,而成熟组织则达到 85%-88%。更有趣的模式是他们使用哪种生成式AI解决方案。

独立的通用生成式AI在不同成熟度水平上的采用率保持平稳,因为它易于在任何地方采用。差距出现在特定于可观测性的实施中。供应商集成、专为可观测性构建以及代理式AI与成熟度相关。

代理式AI清晰地展现了这一点。这些自主系统无需人工启动即可调查问题、关联数据并执行修复。目前有 23% 的团队正在使用它们,另有 38% 计划使用。按成熟度水平划分:

  • 专家团队:35%
  • 成熟团队:28%
  • 进行中:17%
  • 早期阶段:0%

早期阶段为零,因为代理式AI具有早期团队所缺乏的先决条件:全面的遥测、一致的架构、文档化的依赖关系、规范化的应急预案以及成熟的事件响应流程。如果你尚未定义修复的含义,就无法部署自主修复。

如果你仍在构建基础覆盖,应首先专注于供应商集成的生成式AI。自主的部分可以稍后考虑。

可观测性团队的效率提升目前有限

68% 使用生成式AI的团队报告效率提升;只有 14% 认为提升显著。其余的团队认为改善幅度不大。生成式AI有所帮助,但尚未为大多数团队带来运营转型。

对未来五年的预测包括:84% 的团队期望看到改进,56% 期望看到实质性收益,这是当前体验的 4 倍。

这一差距是合理的。当前的实施是第一代,范围有限。团队仍在摸索有效的工作流程。这与其他自动化技术的情况相符——在流程围绕新能力进行重组之前,初期的收益都是有限的。

效率实际上体现在使现有数据变得可访问。许多组织的数据湖未得到充分利用,因为只有少数工程师知道如何查询它们;数据就这样在那里“死去”。自然语言界面能重振这部分投资。原本需要专家花费数分钟的查询,变成了任何人都能完成的 60 秒请求。

即使没有自主修复,仅这一点就足以让许多团队证明其投资的合理性。

生成式AI实际起作用的可观测性领域

关联和自动化驱动了最高价值的应用:

  • 日志、指标、链路的自动关联(58%):在事件发生期间跨遥测类型连接信号。过去这需要了解整个系统的人。
  • 根因分析(49%):跨故障模式、依赖关系和历史数据进行模式匹配。
  • 修复与自动化操作(48%):执行已知程序、扩展资源、应用修复。需要安全护栏。
  • 未知的未知(47%):AI识别出未被监控的异常。在手动告警总有遗漏的分布式系统中非常有用。
  • 辅助任务(47%):报告、仪表盘和查询优化。使非专业人员也能使用可观测性。

担忧是合理的

99% 的人对将生成式AI用于可观测性表示担忧。具体来说:

安全与数据泄露居首,占 61%。遥测数据通常包含敏感信息。将其发送到外部大语言模型是一个确实存在的问题。这推动了人们对将数据保持在现有安全边界内的供应商解决方案的偏好。

幻觉紧随其后,占 53%。AI会生成听起来合理但错误的信息。在事件响应中,基于错误信息行事会使故障更糟。

成功应用生成式AI的团队将其输出视为假设,而非结论。保持人在回路中:AI识别需要升级的设备,暴露问题配置,并在历史数据中发现模式。由人来验证并采取行动。即使不让AI做决策,这也能节省时间。

让AI在没有审查的情况下做出改变是危险的。一个决定打开所有防火墙端口的AI工具会自信地解释为什么这是个好主意——但其实不是。安全护栏和人工审查目前还不是可选项。可能在一段时间内都不是。

对生成式AI整体实用性的怀疑比例较低,为 24%。团队并非质疑其价值,而是在努力解决实施问题。这项技术是有效的;只是尚不成熟,因此应相应地对待它。

大语言模型可观测性:人人计划,无人完成

将生成式AI用于可观测性的组织也在构建需要监控的内部生成式AI应用。85% 计划启用大语言模型可观测性,但只有 8% 已完成。36% 正在进行中;41% 有计划但尚未开始。

这有两个可能的原因。

  • 内部生成式AI开发是新的。
  • 大语言模型可观测性需要传统框架所缺乏的能力,如令牌追踪、提示效果、响应质量、大语言模型特定的延迟以及成本归属。

94% 正在实施或计划实施,因为生成式AI应用需要与任何生产系统同样严格的监控。早期实施者将获得他人所不具备的可见性。而其余的人则对自己的人工智能应用“盲飞”。

OpenTelemetry:成为可观测性数据的默认标准

OTel在生产环境中的应用几乎同比翻倍,从 6% 增至 11%。这些绝对数字仍然不大,但轨迹表明正在加速。

  • 36% 正在试验(高于 31%),但尚未进入生产阶段。
  • 33% 正在评估他们的选择。
  • 19% 对采用 OTel 不感兴趣。

总体而言,仍处于早期采用阶段。但对于新的服务 instrumentation,OTel 正日益成为默认选择。真正的情况不在于采用百分比,而在于团队从评估转向生产时会发生什么。

生产经验改变一切

在将 OTel 投入生产的组织中,89% 认为供应商的合规性至关重要或非常重要;而在仍在评估的团队中,这一比例为 37%。

生产经验告诉你什么才是重要的:完整的规范支持、语义约定的处理、无需增加延迟和丢失保真度的转换层即可直接摄入 OTel。真正符合 OTel 标准的解决方案在生产环境中至关重要。随着越来越多的实施进入生产,供应商对 OTel 的支持从差异化因素转变为必要条件。没有强大原生集成的供应商将被排除在考虑之外。

供应商发行版正在胜出

供应商提供的 OTel 发行版从 44% 增加到 60% —— 同比增长 36%。自定义和原生发行版有所下降。

供应商发行版更易于集成,包含支持,并针对特定用例进行了优化。维护自定义发行版需要工程资源、建立专业知识、测试基础设施和文档——大多数团队有更好的方式来利用这些能力。

优先考虑供应商独立性的组织仍会选择自定义发行版。但更广泛的市场偏好便利性。

根本的转变是数据收集正变得商品化。OTel 以供应商中立的方式处理技术细节。价值和差异化在于数据摄入之后发生的事情——由AI驱动的洞察、调查加速和结果优化。这才是现在有趣的问题所在。

2026年的可观测性供应商选择

生成式AI和 OpenTelemetry 采用的融合为评估可观测性供应商创造了新标准。组织必须评估:

  • 生成式AI集成:来自供应商的集成能力在实现价值的速度上胜过自定义集成。75% 的预计采用率使其成为标准标准。
  • 代理式AI路线图:需求随成熟度增加。在承诺之前,需验证其安全护栏和人机协同控制机制。
  • OTel 支持:89% 的生产用户认为合规性至少非常重要,包括完整的规范支持、语义约定和原生数据摄入。
  • 大语言模型可观测性:85% 有计划,其中令牌追踪、提示管理和成本归属是供应商的差异化因素。
  • 安全性:61% 将安全视为实施生成式AI时的主要担忧。供应商需要强大的控制力和透明度。

2026年可观测性的全新格局

生成式AI和 OpenTelemetry 正从新兴技术走向基础技术。预计两年内生成式AI的采用率将达到 98%。OTel 增长缓慢但稳定,随着实施的成熟,其战略重要性日益增加。

供应商选择标准正在转变。集成的生成式AI、全面的 OpenTelemetry 支持以及大语言模型可观测性功能正成为可观测性平台的要求。投资于这些领域的供应商将处于有利位置;其余的将面临劣势。请根据这些新要求评估你的解决方案,因为延迟会带来风险,而行业不会等待。FINISHED
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐