Azure Cosmos DB 向量存储技术博客

Azure Cosmos DB 向量存储结合 DiskANN 技术，为 AI 语义检索和大模型应用提供了全球分布式、弹性扩展和高效检索的基础设施。通过 Spring AI 集成，开发者可以用极少的配置和代码，快速实现向量存储、相似度搜索和复杂过滤，极大提升了 AI 应用的生产力和稳定性。

北漂老男孩

613人浏览 · 2025-11-20 10:20:22

北漂老男孩 · 2025-11-20 10:20:22 发布

Azure Cosmos DB 向量存储技术博客

1. 概述

随着 AI 应用和大模型的兴起，海量数据的向量化和高效检索成为核心需求。Azure Cosmos DB 作为微软推出的全球分布式数据库服务，结合 DiskANN 向量检索技术，成为支撑 AI 向量存储和相似度搜索的理想基础设施。本文将系统讲解 Azure Cosmos DB 向量存储的原理、技术发展、项目实践，并以 Spring AI 集成为例，给出代码示范和配置详解，配合多种 mermaid 图表梳理技术架构和流程。

2. 名词解释

Azure Cosmos DB
微软云原生全球分布式数据库，支持多模型（NoSQL、MongoDB、Cassandra 等），核心优势是高可用性、低延迟、弹性扩展。
DiskANN
Disk-based Approximate Nearest Neighbor Search，磁盘级近似最近邻检索算法，能高效处理大规模高维向量数据，极大提升向量相似搜索性能。
向量存储（Vector Store）
以嵌入向量为核心的数据存储方式，支持相似度检索，广泛用于文本、图像、语音等 AI 应用。
Spring AI
一个 Spring 生态的 AI 集成框架，简化向量存储、嵌入模型、检索等 AI 相关功能的开发和配置。

3. 项目背景与发展历史

3.1 Azure Cosmos DB 的发展

Azure Cosmos DB 于 2017 年发布，继承了 DocumentDB 的技术基础，定位为全球分布式、高可用、低延迟的云数据库。随着 Office 365、Teams、Xbox Live 等微软核心业务的全球化，Cosmos DB 成为后端数据的基础支撑。
2023 年，微软为 AI 和大模型场景引入向量存储功能，支持 DiskANN 技术，成为 OpenAI ChatGPT 等 AI 应用的后端基础。

权威资料：

3.2 DiskANN 技术演变

DiskANN 最早由微软研究院提出，旨在解决大规模、高维度数据的近似最近邻检索问题。其核心创新为利用磁盘索引结构，突破内存瓶颈，实现高效、低延迟的向量检索。
DiskANN 现已集成在 Azure Cosmos DB、Bing 搜索、Office 365 等微软产品中。

4. 系统性认知与速记口

Cosmos DB = 全球分布式数据库，支持多模型，弹性扩展。
DiskANN = 磁盘级近似最近邻检索，突破内存瓶颈，支持亿级高维向量。
Spring AI 集成 = 向量存储能力一键接入，支持自动/手动配置，代码简洁。
应用场景 = AI 大模型、语义检索、推荐系统、智能问答。
优势速记：高可用、低延迟、弹性扩展、AI 原生、全球分布。

5. 技术架构与流程图解

5.1 Cosmos DB 向量存储架构

说明：应用通过 Spring AI VectorStore 操作 Cosmos DB，底层由 DiskANN 支持高效向量检索。

5.2 向量检索状态流程

说明：典型流程包括初始化、写入、检索、处理结果、删除，闭环管理向量生命周期。

5.3 向量搜索序列流程

说明：用户通过 SpringAI 发起检索，底层由 CosmosDB 和 DiskANN 完成高效搜索。

6. Spring AI 集成实践

6.1 自动配置方式（推荐）

Maven 依赖

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-starter-vector-store-azure-cosmos-db</artifactId>
</dependency>

主要配置参数

配置项	说明
spring.ai.vectorstore.cosmosdb.databaseName	数据库名称
spring.ai.vectorstore.cosmosdb.containerName	容器名称
spring.ai.vectorstore.cosmosdb.partitionKeyPath	分区键路径
spring.ai.vectorstore.cosmosdb.metadataFields	元数据字段
spring.ai.vectorstore.cosmosdb.vectorStoreThroughput	吞吐量
spring.ai.vectorstore.cosmosdb.vectorDimensions	向量维度
spring.ai.vectorstore.cosmosdb.endpoint	Cosmos DB 端点
spring.ai.vectorstore.cosmosdb.key	Cosmos DB 密钥

代码示例

@SpringBootApplication
@EnableAutoConfiguration
public class DemoApplication implements CommandLineRunner {
    @Lazy @Autowired private VectorStore vectorStore;

    @Override
    public void run(String... args) throws Exception {
        Document document1 = new Document(UUID.randomUUID().toString(), "Sample content1", Map.of("key1", "value1"));
        Document document2 = new Document(UUID.randomUUID().toString(), "Sample content2", Map.of("key2", "value2"));
        vectorStore.add(List.of(document1, document2));
        List<Document> results = vectorStore.similaritySearch(SearchRequest.builder().query("Sample content").topK(1).build());
        log.info("Search results: {}", results);
        vectorStore.delete(List.of(document1.getId(), document2.getId()));
    }
}

6.2 复杂过滤检索

Map<String, Object> metadata1 = Map.of("country", "UK", "year", 2021, "city", "London");
Map<String, Object> metadata2 = Map.of("country", "NL", "year", 2022, "city", "Amsterdam");
Document document1 = new Document("1", "A document about the UK", metadata1);
Document document2 = new Document("2", "A document about the Netherlands", metadata2);
vectorStore.add(List.of(document1, document2));

FilterExpressionBuilder builder = new FilterExpressionBuilder();
List<Document> results = vectorStore.similaritySearch(SearchRequest.builder()
    .query("The World")
    .topK(10)
    .filterExpression(builder.in("country", "UK", "NL").build())
    .build());

6.3 非自动配置方式

Maven 依赖

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-azure-cosmos-db-store</artifactId>
</dependency>

Bean 配置示例

@Bean
public VectorStore vectorStore(ObservationRegistry observationRegistry) {
    CosmosAsyncClient cosmosClient = new CosmosClientBuilder()
        .endpoint(System.getenv("COSMOSDB_AI_ENDPOINT"))
        .credential(new DefaultAzureCredentialBuilder().build())
        .userAgentSuffix("SpringAI-CDBNoSQL-VectorStore")
        .gatewayMode()
        .buildAsyncClient();

    return CosmosDBVectorStore.builder(cosmosClient, embeddingModel())
        .databaseName("test-database")
        .containerName("test-container")
        .metadataFields(List.of("country", "year", "city"))
        .partitionKeyPath("/id")
        .vectorStoreThroughput(1000)
        .vectorDimensions(1536)
        .batchingStrategy(new TokenCountBatchingStrategy())
        .observationRegistry(observationRegistry)
        .build();
}

@Bean
public EmbeddingModel embeddingModel() {
    return new TransformersEmbeddingModel();
}

7. 权威资料与参考文献

8. 总结

9. 速记口诀

“全球分布，弹性扩展，DiskANN 快速索引，SpringAI 一键集成，AI 检索无忧！”

（如需更多 mermaid 图表或代码示例，可留言补充！）

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【必收藏】提示词工程：零门槛解锁大模型核心能力的实战指南

2048 AI社区

JoyAgent-JDGenie-Backend 技术FAQ文档

DeepThink 值AgentType模式名称Handler执行特点05REACT单Agent，简单任务，快速响应非03PLAN_SOLVE多Agent协作，复杂任务，深度思考组件文件路径方法ToolChoice设置think()think()think()LLM处理askTool()接收并传递给模型维度支持情况实现方式限制单次请求内多轮✅ 完全支持Memory类管理消息历史仅在Agent执行期