音频模型

Spring AI 通过不同的提供商提供各种音频处理功能支持。音频功能主要分为两个主要类别:

转录

使用各种 AI 模型将语音转换为文本:

语音合成

将文本转换为语音:

每个提供商都为其各自的音频处理功能实现了特定的接口,使您能够在保持一致的 API 的同时使用不同的 AI 模型。

文档有误?请协助编辑

发现文档问题?点击此处直接在 GitHub 上编辑并提交 PR,帮助我们改进文档!