Azure Cosmos DB 向量数据库
Azure Cosmos DB NoSQL 向量数据库
Spring AI 支持使用 Azure Cosmos DB for NoSQL 作为向量数据库,通过其向量嵌入和索引功能。
先决条件
- Azure 账户:您需要一个拥有有效订阅的 Azure 账户。
- Azure Cosmos DB for NoSQL 资源:在您的 Azure 账户中创建一个 Azure Cosmos DB for NoSQL 账户。
- 在创建过程中,请确保选择”NoSQL” API。
- 记下您的 Cosmos DB 端点和主密钥,因为在应用程序配置中将会用到它们。
- 向量嵌入功能:目前,Azure Cosmos DB for NoSQL 中的向量搜索功能处于预览阶段。您需要按照这些说明注册预览版。
添加依赖
将 spring-ai-azure-cosmos-db-store-spring-boot-starter
依赖项添加到您的 pom.xml
文件中:
您还需要一个 EmbeddingClient
实现来为您的文档生成向量嵌入。例如,您可以添加 spring-ai-openai-spring-boot-starter
以使用 OpenAI 的嵌入模型:
配置属性
在您的 application.properties
或 application.yml
文件中配置 Azure Cosmos DB 和嵌入客户端属性。
Azure Cosmos DB 属性
如果 create-container-if-not-exists
设置为 true
,则当容器尚不存在时,将使用提供的 indexing-policy
创建它。
如果容器已存在,则现有索引策略将保持不变,并且提供的 indexing-policy
配置将被忽略。
确保嵌入客户端输出的维度与索引策略中配置的 dimensions
匹配。
嵌入客户端属性 (例如 OpenAI)
使用 VectorStore
将 VectorStore
bean 注入到您的组件中以与之交互:
创建 CosmosDBVectorStore
Bean (可选)
Spring Boot 会自动配置 CosmosDBVectorStore
bean。但是,如果您需要自定义配置,可以定义自己的 bean:
向量索引
Azure Cosmos DB for NoSQL 支持多种类型的向量索引,例如 vector-ivf
和 vector-hnsw
。索引的选择取决于您的特定用例和性能要求。
vector-ivf
(Inverted File Index):适用于大型数据集,并在准确性和查询速度之间提供良好的平衡。它将向量空间划分为簇,并在查询时仅搜索最相关的簇。vector-hnsw
(Hierarchical Navigable Small World):一种基于图的索引,以其高查询召回率和低延迟而闻名,尤其适用于高维数据。
您可以在 application.properties
中的 spring.ai.vectorstore.cosmosdb.indexing-policy.vector-indexes
下或在以编程方式配置 CosmosDBVectorStoreConfig
时配置索引类型、维度、距离函数和特定于类型的参数 (例如 num-lists
for IVF)。
有关向量索引的更多详细信息,请参阅 Azure Cosmos DB for NoSQL 向量索引文档。
元数据过滤
Cosmos DB 向量存储支持使用 SQL WHERE子句 和 相似性搜索过滤器表达式 进行元数据过滤。这些过滤器应用于相似性搜索查询期间,以根据其元数据字段缩小结果范围。
过滤器表达式直接转换为 Cosmos DB SQL WHERE 子句。
例如,如果您有带有元数据字段 genre
和 year
的文档,则可以按如下方式进行过滤:
这将转换为类似于以下的 Cosmos DB 查询:
确保您的容器中存在用于过滤的元数据字段,并且它们已正确索引 (如果需要提高性能)。
并非所有 Spring AI 过滤器表达式操作符都直接映射到 Cosmos DB SQL 函数。支持基本比较 (EQ
, NE
, GT
, GTE
, LT
, LTE
)、逻辑运算符 (AND
, OR
, NOT
) 和 IN
/ NIN
。
删除数据
CosmosDBVectorStore
支持通过文档 ID 删除数据。
总结
通过将 Spring AI 与 Azure Cosmos DB for NoSQL 集成,您可以利用 Azure 的可扩展且全球分布的数据库服务来满足您的向量存储需求,并结合 Spring AI 的简化抽象来构建强大的 AI 应用程序。
文档有误?请协助编辑
发现文档问题?点击此处直接在 GitHub 上编辑并提交 PR,帮助我们改进文档!