更高的吞吐量和更低的延迟： Elastic Cloud Serverless 在 AWS 上获得了显著的性能提升

Elastic宣布AWS上的Elasticsearch Serverless基础设施已完成重大升级，迁移至更新更快的硬件。此次升级带来显著性能提升：搜索延迟平均降低35%，索引吞吐量提高26%，尤其在向量搜索和AI应用场景表现突出。新硬件还增强了自动扩展能力，能更高效应对流量高峰。基准测试显示，各类搜索操作的吞吐量提升31-52%，延迟下降37-38%。升级完全自动完成，用户无需任何操作即可享受更

Elastic 中国社区官方博客

218人浏览 · 2026-01-15 07:40:50

Elastic 中国社区官方博客 · 2026-01-15 07:40:50 发布

作者：来自 Elastic Pete Galeotti, Yuvraj Gupta 及 Rachel Forshee

我们已将 AWS 上的 Elasticsearch Serverless 基础设施升级为更新、更快的硬件。了解这一巨大的性能提升如何带来更快的查询、更好的扩展能力以及更低的成本。

使用 Elastic Cloud Serverless 解放你自己，远离运维负担。自动扩展，应对负载高峰，专注于构建 —— 开始 14 天免费试用，亲自体验！

你可以按照这些指南来构建 AI 驱动的搜索体验，或在业务系统和软件之间进行搜索。

Elastic Cloud Serverless 已经是希望在无需管理基础设施运维负担的情况下，构建高效搜索和 AI 应用的开发者的权威解决方案。现在，我们正将你的 serverless 项目的性能提升到一个全新的水平。

我们已为所有运行在 AWS 上的 Elastic Cloud Serverless 项目完成了一次重大的基础设施升级，迁移到更新、更快的硬件。这一变更已自动推送到每一个 serverless 项目。它为 AWS 上的 Elasticsearch、Elastic Observability 和 Elastic Security serverless 项目带来了更高的吞吐量和更低的延迟。

为开发者带来的关键性能优势

全新的 AWS 硬件基础设施支撑着你使用 Elastic Cloud Serverless 所做的一切，为你的应用速度和响应能力带来切实的收益。

降低查询延迟 …… 提升吞吐量

改进后的硬件大幅提升了计算资源的速度，这意味着你的搜索查询比以往任何时候都处理得更快。

搜索与向量搜索：无论你运行的是传统的全文查询，还是用于生成式 AI 和检索增强生成（ RAG ）应用的前沿向量搜索，你都会看到明显的延迟下降。内部基准测试显示，搜索延迟平均降低了 35%。
更快的索引：数据摄取速率得到优化，使你能以更高的吞吐量索引海量数据和复杂文档。这对于需要近实时数据可见性的应用至关重要。内部基准测试显示，索引吞吐量平均提升了 26%。

高负载下的稳定性能

Elastic Cloud Serverless 旨在实时动态自动扩展以满足需求，无论你的工作负载如何，都能将延迟降到最低。随着这次硬件升级，这种扩展能力现在变得更加高效和灵敏。

轻松应对突发高峰：无论你面临的是用户流量的突然激增，还是大规模批量数据摄取，全新的基础设施都能确保你的搜索和索引资源更高效地扩展，从而保持持续的低延迟。
优化的计算与存储解耦：serverless 架构将计算和存储分离，使工作负载能够独立扩展，从而实现最佳性能和成本效率。更快的硬件增强了计算层，最大化了这种解耦设计的效率。

幕后揭秘：内部基准测试结果

为了量化 AWS 基础设施升级的影响，Elastic 工程团队对一系列 serverless 工作负载进行了全面的内部基准测试。这些工作负载提供了性能提升的实证证据，无论你的应用场景如何，你都可以预期类似的性能改进。

基准测试方法

我们的测试重点是直接影响开发者体验和应用响应性的关键指标：搜索和索引操作的响应时间（即延迟）和吞吐量。

测试工作负载：测试包括用户应用典型的高并发搜索操作、复杂的向量搜索查询，以及用于可观测性和安全用例的大规模数据摄取/索引。特别地，我们的测试方法使用了 Elastic 基准工具 Rally 的公开数据集。
- wikipedia：从 Wikipedia 文本内容快照衍生的数据集，用于衡量通用文本搜索性能。
- MSMARCO-Passage-Ranking：从 Microsoft 的 Machine Reading Comprehension (MS MARCO) 衍生的数据集，用于衡量稀疏向量字段的搜索性能。
- OpenAI_Vector：从 BEIR 的 NQ 衍生并使用 OpenAI 的 text-embedding-ada-002 模型生成 embedding 的数据集，用于衡量密集向量字段的搜索性能。
测量方法：我们比较了旧基础设施和新基础设施的性能，测量了第 99 百分位延迟（P99）以捕获最差情况的尾延迟性能，以及每秒操作数。每条测试轨道在每种硬件配置下运行五次，以确保结果一致性。
目标：我们的目标是验证基础设施在快速自动扩展期间，也能在整体上提供持续更快和更可预测的性能。

性能数据总结

结果确认了效率和速度的显著提升。这些提升直接转化为用户的响应时间降低，以及由于能够以更少的计算资源完成相同工作量而降低的运营成本。

以下表格详细说明了量化改进。吞吐量越高越好；延迟越低越好。

搜索基准测试结果：

基准测试	对比	旧基础设施	新基础设施	差异
`wikipedia` (纯文本)	搜索操作吞吐量 (ops/s)	729	1107	+52%
`wikipedia` (纯文本)	搜索操作延迟 (p99, ms)	56	35	-37%
`MSMARCO-Passage-Ranking` (稀疏向量)	搜索操作吞吐量 (ops/s)	22	31	+40%
`MSMARCO-Passage-Ranking` (稀疏向量)	搜索操作延迟 (p99, ms)	108	67	-38%
`OpenAI_Vector` (密集向量)	搜索操作吞吐量 (ops/s)	475	624	+31%
`OpenAI_Vector` (密集向量)	搜索操作延迟 (p99, ms)	35	22	-37%

索引基准测试结果：

基准测试	比较	旧基础设施	新基础设施	差异
`wikipedia` (纯文本)	索引操作吞吐量 (ops/s)	2845	3220	+13%
`wikipedia` (纯文本)	索引操作延迟 (p99, ms)	1769	1120	-37%
`MSMARCO-Passage-Ranking` (稀疏向量)	索引操作吞吐量 (ops/s)	7087	8900	+26%
`MSMARCO-Passage-Ranking` (稀疏向量)	索引操作延迟 (p99, ms)	824	677	-18%
`OpenAI_Vector` (密集向量)	索引操作吞吐量 (ops/s)	2972	3187	+7%
`OpenAI_Vector` (密集向量)	索引操作延迟 (p99, ms)	2946	2944	0%

额外好处：成本降低

虽然我们专注于提供低延迟性能，但新硬件的高效率也直接正面影响 Elasticsearch 项目的成本。

Elasticsearch Serverless 的定价基于使用量，这意味着你只需为你消耗的 ingest 和 search 资源付费。由于更新、更快的硬件更高效，你的工作负载通常可以使用更少的资源完成任务，从而为大多数项目带来固有的成本降低。你可以在不支付额外价格的情况下获得性能提升——这就是优化效率的定义。

这对你开发者意味着什么？

此基础设施升级完全由 Elastic 管理，所以你无需动手 —— 无需迁移，也无需配置更改。提升在所有基于 AWS 的 serverless 项目上都是即时且自动的。

这次升级让你能够：

构建更快速的应用：专注于功能开发速度，同时知道你的底层搜索平台能提供用户所需的速度。
自信创新：部署新的搜索、可观测性和安全功能——包括复杂的 AI 功能，如向量搜索和相关性排序——并确保平台在高峰期依然可以高性能处理负载。
简化你的技术栈：使用完全托管的服务处理基础设施管理、容量规划和扩展，让你专注于代码和数据。

原文：https://www.elastic.co/search-labs/blog/elasticsearch-serverless-aws-performance-boost

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

智能需求分析系统：AI服务的熔断机制设计

假设你是一家软件公司的产品经理，需要设计一个智能需求分析系统——用户输入自然语言需求（比如"我要做一个支持多人协作的在线文档工具"），系统能自动解析需求的核心要素（功能、用户、场景）、分类（工具类/电商类/社交类），甚至生成初步的需求文档框架。这个系统的"心脏"是什么？AI服务——比如调用GPT-4解析意图、用Claude提取实体、用LLaMA-2生成文档。没有AI服务，系统就是个"空壳"；不稳定