作者:来自 Elastic Elastic DevRel team

来自 Elastic DevRel 团队的问候!在本期通讯中,我们将介绍 Elasticsearch 和 Elastic Stack 的 9.3 版本、最新的博客和视频,以及即将举行的活动,包括 Agent Builder 黑客松。

有什么新内容?

之前版本中引入的多个功能现在已在 Elasticsearch 和 Elastic Stack 的 9.3 版本中正式发布,包括:

  • Elastic Agent Builder,用于构建能够基于 Elasticsearch 数据进行推理的 AI agent
  • 基于模式的日志压缩( pattern_text ),用于降低日志存储成本
  • Elastic Security 中的 Entity AI Summary
  • 扩展的 Elastic Inference Service( EIS )模型可用性,包括 Jina 模型

9.3 还引入了向量存储、 GPU 加速以及分析性能方面的改进。

Elastic Workflows:在 Elastic Stack 中构建自动化

Elastic Workflows 是内置于 Kibana 的自动化引擎。你可以使用 YAML 定义工作流 —— 它们的触发方式、执行步骤以及执行的操作 —— 平台负责执行。一个工作流可以查询 Elasticsearch、转换数据、基于条件进行分支、调用外部 API,并通过你已配置的连接器与 Slack、 Jira、 PagerDuty 等服务集成。

一个 workflow 由几个关键部分组成:triggers、inputs 和 steps。

  • triggers 决定 workflow 何时运行。一个 workflow 可以有多个 triggers。
    • alert trigger 在 Kibana 告警规则触发时运行,并可完全访问告警上下文。
    • scheduled trigger 按时间间隔或 cron 模式运行。
    • manual trigger 可通过 UI 或 API 按需运行。
  • inputs 定义在运行时可传递给 workflow 的参数。这让你可以创建可复用的 workflow,并根据不同的调用方式接受不同的值。
  • steps 是 workflow 执行的具体操作。它们按顺序执行,每个 step 都可以引用之前 step 的输出。step 类型包括:
    • 内部 actions,用于在 Elasticsearch 和 Kibana 内部执行操作,例如查询索引、运行 Elasticsearch Query Language( ES|QL )、创建 case 或更新告警。
    • 外部 actions,用于在外部系统上执行操作,例如发送 Slack 消息或创建 Jira 工单。你可以使用在 Elastic 中已配置的任意 connector,并通过 HTTP steps 灵活调用任何 API 或内部服务。
    • 流程控制,用于通过条件判断、循环和并行执行来定义 workflow 的逻辑。
    • AI,用于从提示 large language model( LLM )到将 agent 作为 workflow step 启用,从而解锁 agentic workflow 使用场景。

Dense vectors 的 bfloat16 支持

Elasticsearch 9.3 新增了对使用 bfloat16 而不是 32 位浮点值来存储 dense vectors 的支持。这大约可以将向量存储减少一半,并降低内存压力,同时仍然为许多语义搜索和 RAG 工作负载保留足够的精度。

这在以下场景中特别有用:

  • 高维 embeddings(例如 768 或更多维度)
  • 大型向量集合
  • 受内存或磁盘占用限制的部署

使用 bfloat16 vectors 创建索引:

PUT my-vector-index
{
  "mappings": {
    "properties": {
      "embedding": {
        "type": "dense_vector",
        "dims": 768,
        "element_type": "bfloat16",
        "index": true
      }
    }
  }
}

与基于 float 的 vectors 相比,文档索引方式没有变化:

POST my-vector-index/_doc
{
  "embedding": [0.01234567,-0.98123456,0.44319876, "..."]
}

kNN 查询使用与之前相同的语法,降低的精度会被透明地处理:

POST my-vector-index/_search
{
  "knn": {
    "field": "embedding",
    "query_vector": [0.02123456,-0.97345678,0.41765432,"..."],
    "k": 10,
    "num_candidates": 30
  }
}

bfloat16 vectors 可以与基于磁盘的向量索引以及磁盘上的重新评分结合使用,从而在大规模语义搜索工作负载中进一步降低内存使用。

用于向量索引和推理的 GPU 加速

Elastic 9.3 继续扩展对向量密集型工作负载的 GPU 支持。

对于自管理部署,GPU 加速的向量索引(技术预览)允许索引和维护任务在由 cuVS 驱动的 NVIDIA GPU 上运行。已观察到的改进包括:

  • 向量索引吞吐量提升高达 12x
  • force-merge 操作速度提升高达 7x
  • 在高强度数据摄取期间显著降低 CPU 使用率

这些改进有助于在构建或重建大型向量索引时缩短到可搜索状态的时间。

在推理方面,Elastic Inference Service( EIS )继续使用托管的 GPU 基础设施来生成 embeddings 和执行 reranking。这使用户无需在自己的 Elasticsearch 集群中部署或运维 GPU,也能享受到 GPU 加速带来的好处。

ES|QL:更快且更稳定的时间序列分析

在 9.3 中,改进重点放在指标性能和仪表板稳定性上,包括:

  • 滑动窗口聚合,减少时间序列可视化中的抖动
  • 用于指标查询的更快执行路径
  • 指数直方图的原生支持

例如,现在可以直接在 ES|QL 中表达对请求速率随时间的平滑处理:

TS metrics
| WHERE TRANGE(1h)
| STATS avg(rate(requests, 10m)) BY TBUCKET(1m), host

这些变化让 ES|QL 更适合用于始终在线的仪表板和运营分析,而不仅仅是探索性查询。

博客、视频和有趣的链接

查看这些视频:

社区精选博客:

即将举行的活动

加入 Agent Builder hackathon,与社区一起构建上下文驱动、多步骤的 AI agents。争夺 $20,000 奖金,并在我们的博客和社交渠道上亮相 — 截止日期 2026 年 2 月 27 日。

Elastic{ON} Tour,全球一日 Elastic 大会系列,回归。注册并参加以下城市活动:

  • São Paulo — 2026 年 3 月 5 日
  • Sydney — 2026 年 3 月 5 日
  • Tokyo — 2026 年 3 月 10 日
  • Singapore — 2026 年 3 月 17 日
  • Washington, D.C. — 2026 年 3 月 19 日

加入本地 Elastic User Group 分会,获取最新活动资讯!你也可以在 Meetup.com 上找到我们。如果你有兴趣在 meetup 上展示,请发送邮件至 meetups@elastic.co

本文中描述的任何功能或特性发布时间完全由 Elastic 决定。当前不可用的功能可能不会按时或根本不会提供。

原文:https://www.elastic.co/blog/devrel-newsletter-february-2026

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐