下表比较了 Spring AI 支持的各种聊天模型,详细说明了它们的功能:

  • 多模态:模型可以处理的输入类型(例如,文本、图像、音频、视频)。
  • 工具/函数调用:模型是否支持函数调用或工具使用。
  • 流式传输:模型是否提供流式响应。
  • 重试:支持重试机制。
  • 可观察性:用于监控和调试的功能。
  • 内置 JSON:对 JSON 输出的原生支持。
  • 本地部署:模型是否可以在本地运行。
  • OpenAI API 兼容性:模型是否与 OpenAI 的 API 兼容。
提供商多模态工具/函数流式传输重试可观察性内置 JSON本地OpenAI API 兼容性
Anthropic Claude文本、pdf、图像
Azure OpenAI文本、图像
DeepSeek (OpenAI-proxy)文本
Google VertexAI Gemini文本、pdf、图像、音频、视频
Groq (OpenAI-proxy)文本、图像
HuggingFace文本
Mistral AI文本、图像
MiniMax文本
Moonshot AI文本
NVIDIA (OpenAI-proxy)文本、图像
OCI GenAI/Cohere文本
Ollama文本、图像
OpenAI输入:文本、图像、音频
输出:文本、音频
Perplexity (OpenAI-proxy)文本
QianFan文本
ZhiPu AI文本
Amazon Bedrock Converse文本、图像、视频、文档 (pdf, html, md, docx …)

文档有误?请协助编辑

发现文档问题?点击此处直接在 GitHub 上编辑并提交 PR,帮助我们改进文档!