音频模型

Spring AI 通过不同的提供商提供各种音频处理功能支持。音频功能主要分为两个主要类别：

转录

使用各种 AI 模型将语音转换为文本：

语音合成

将文本转换为语音：

OpenAI 语音

每个提供商都为其各自的音频处理功能实现了特定的接口，使您能够在保持一致的 API 的同时使用不同的 AI 模型。

文档有误？请协助编辑

发现文档问题？点击此处直接在 GitHub 上编辑并提交 PR，帮助我们改进文档！

千帆图像模型音频转录