有孚云智算-大模型api调用指南
有孚云智算-大模型API调用指南
1. 端点说明
接口均遵循openai规范,https://platform.openai.com/docs/api-reference/introduction
ds-api网关:专属的大模型网关服务,包括不限于聊天的模型,同时具有负载均衡,智能调度,流控等高级功能,主要提供API服务。
内网专线接口:也是调用的ds-api的服务,只是走的服务内网的网络,理论上速度更快,适合有孚云上有云资源的用户。
端点地址 | http://ds-api.yovole.com/ |
---|---|
端口说明 | 由ds-api网关提供服务,性能更好 |
模型列表 | 聊天模型,embedding模型,rerank模型,语音,问生图等 |
秘钥获取 | API-key管理中自助创建 |
备注信息 | 签约租户,包年租户等 |
场景应用 | 独立部署渠道,企业级应用,AI集成开发 |
注意:端点地址对于有孚云租户支持走内网的方式,内网专线更快!
2. 聊天(chat)
2.1. 接口完整地址
https://ds-api.yovole.com/v1/chat/completions #专有网关接口地址
https://[ip]/v1/chat/completions #内网专线接口地址
2.2. 模型列表
请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。
模型ID | 备注 |
---|---|
DeepSeek-R1 | DeepSeek 系列模型 |
DeepSeek-R1-Distill-Qwen-32B | DeepSeek 蒸馏 Qwen-32B 模型 |
DeepSeek-V3 | DeepSeek V3 模型 |
QwQ-32B | Qwen3 系列模型 |
Qwen2.5-72B-Instruct | Qwen2.5 72B 指令微调模型 |
Qwen2.5-Coder-32B-Instruct | Qwen2.5 Coder 32B 指令微调模型 |
Qwen2.5-VL-32B-Instruct | Qwen2.5 VL 32B 指令微调模型 |
Qwen2.5-VL-72B-Instruct | Qwen2.5 VL 72B 指令微调模型 |
Qwen3-14B | Qwen3 14B 模型 |
Qwen3-30B-A3B | Qwen3 30B A3B 模型 |
Qwen3-32B | Qwen3 32B 模型 |
nim.deepseek-r1-distill-llama-8b | nim 系列 DeepSeek R1 Distill Llama 8B |
nim.llama-3.3-70b-instruct | nim 系列 Llama 3.3 70B 指令微调模型 |
nim.llama3.2-11b-vl-instruct | nim 系列 Llama3.2 11B VL 指令微调模型 |
nim.qwen-2.5-7b-instruct | nim 系列 Qwen 2.5 7B 指令微调模型 |
Qwen3-Next-80B-A3B-Instruct | Qwen3 Next 80B A3B 指令微调模型 |
gpt-oss-120b | GPT OSS 120B 模型 |
glm-4.6 | GLM 4.6 模型 |
kimi-k2-instruct | Kimi K2 指令微调模型 |
qwen3-coder-plus | Qwen3 Coder Plus 编程模型 |
2.3. 请求
curl -X 'POST' \
'https://ds-api.yovole.com/v1/chat/completions' \
-H 'Content-Type: application/json' \
-H "Authorization: Bearer [秘钥请替换]" \
-d '{
"model": "DeepSeek-V3",
"messages": [
{
"role":"user",
"content":"你是谁!"
}
],
"top_p": 1,
"n": 1,
"max_tokens": 5500,
"stream": false,
"frequency_penalty": 1.0,
"stop": ["hello"]
}' | jq
参数说明:
model
: 使用的模型ID,例如 "DeepSeek-V3"messages
: 输入的消息列表,包含角色(role)和内容(content)。role 可选 "user", "system", "assistant"top_p
: 控制生成文本的多样性,取值范围 0-1,1 表示完全随机,0 表示贪婪策略n
: 生成的候选响应数量max_tokens
: 生成文本的最大长度stream
: 是否以流式方式接收响应,布尔值frequency_penalty
: 对重复 token 的惩罚,越大越不容易重复stop
: 停止生成的 token 列表2.4. 响应
{ "id": "chatcmpl-716224c7642c41a38098393112a9f378", "object": "chat.completion", "created": 1747453469, "model": "DeepSeek-V3", "choices": [ { "index": 0, "message": { "role": "assistant", "reasoning_content": null, "content": "我是DeepSeek Chat,由深度求索公司研发的智能AI助手!✨ 我可以帮你解答各种问题、提供知识支持、陪你聊天,还能帮你整理文档、分析数据等等。如果有什么想知道的,尽管问我吧!😊 \n\n你是对AI感兴趣,还是有什么具体的问题需要帮助呢?", "tool_calls": [] }, "logprobs": null, "finish_reason": "stop", "stop_reason": null } ], "usage": { "prompt_tokens": 5, "total_tokens": 72, "completion_tokens": 67, "prompt_tokens_details": null }, "prompt_logprobs": null }
3. 文生图(text2img)
3.1. 接口完整地址
https://ds-api.yovole.com/v1/images/generations #专有网关接口地址
https://[ip]/v1/images/generations #内网专线接口地址
3.2. 模型列表
请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。
模型ID | 备注 |
---|---|
FLUX.1-dev | 生成图片模型,用于生成高质量的图片 |
HunyuanDiT | 智能AI助手模型,用于文本生成、对话和知识分享 |
3.3. 请求
curl -X 'POST' \
'https://ds-api.yovole.com/v1/images/generations' \
-H "Content-Type: application/json" \
-H "Authorization: Bearer [秘钥请替换]" \
-d '{
"prompt": "a cute cat",
"n": 1,
"size": "1024x1024",
"model": "FLUX.1-dev",
"response_format": "b64_json" #只能选b64_json
}'
参数说明:
prompt
: 生成图片的文本描述n
: 生成的图片数量size
: 生成图片的尺寸,可选 "1024x1024", "1024x1792", "1792x1024"model
: 使用的图片生成模型ID,例如 "FLUX.1-dev"response_format
: 响应格式,目前只支持 "b64_json",表示返回base64的图片。
3.4. 响应
{
"created": 1747450758,
"data": [
{
"url": null,
"b64_json": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAA..."
}
]
}
4. 向量嵌入(embedding)
4.1. 接口完整地址
https://ds-api.yovole.com/v1/embeddings #专有网关接口地址
https://[ip]/v1/embeddings #内网专线接口地址
4.2. 模型列表
请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。
模型ID | 备注 |
---|---|
bge-m3 | 文本嵌入模型,用于将文本转换为向量表示 |
4.3. 请求
curl -X 'POST' \
'https://ds-api.yovole.com/v1/embeddings' \
-H "Content-Type: application/json" \
-H "Authorization: Bearer [秘钥请替换]" \
-d '{
"input": "Your text string goes here",
"model": "bge-m3"
}'
参数说明:
input
: 用于生成嵌入向量的文本或文本列表model
: 使用的文本嵌入模型ID,例如 "bge-m3"
4.4. 响应
{
"object": "list",
"data": [
{
"object": "embedding",
"embedding": [0.123, 0.456, ...],
"index": 0
}
],
"model": "bge-m3",
"usage": {
"prompt_tokens": 5,
"total_tokens": 5
}
}
5. 排序模型(rerank)
5.1. 模型列表
请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。
模型ID | 备注 | 接口地址 |
---|---|---|
bce-reranker-base-v1 | rerank排序模型,百度语义相关性模型 | https://ds-api.yovole.com/reranker/v1/rerank #专有网关接口地址 https://[ip]/reranker/v1/rerank #内网专线接口地址 |
bge-reranker-v2-m3 | rerank排序模型,推荐,效果更优 | https://ds-api.yovole.com/reranker/v2/rerank #专有网关接口地址 https://[ip]/reranker/v2/rerank #内网专线接口地址 |
5.2. 请求
curl -X 'POST' \
'https://ds-api.yovole.com/reranker/v2/rerank' \
-H "Content-Type: application/json" \
-H "Authorization: Bearer [秘钥请替换]" \
-d '{"query": "iphone", "documents": ["我买了个苹果,好吃的","苹果树,香蕉树,桃子树", "苹果手机", "新款手机"]}'
参数说明:
model
: 使用的 rerank 模型ID,例如 "bge-reranker-v2-m3"query
: 用于排序的查询文本documents
: 待排序的文本列表
5.3. 响应
{
"id": "rerank-bab5a4874aac4839ab4304d47050fba5",
"model": "bge-reranker-v2-m3",
"usage": {
"total_tokens": 43
},
"results": [
{
"index": 2,
"document": {
"text": "苹果手机"
},
"relevance_score": 0.97802734375
},
{
"index": 3,
"document": {
"text": "新款手机"
},
"relevance_score": 0.69921875
},
{
"index": 0,
"document": {
"text": "我买了个苹果,好吃的"
},
"relevance_score": 0.07275390625
},
{
"index": 1,
"document": {
"text": "苹果树,香蕉树,桃子树"
},
"relevance_score": 0.0031108856201171875
}
]
}
6. 文本转语音(TTS)
6.1. 接口完整地址
https://ds-api.yovole.com/v1/audio/speech #专有网关接口地址
https://[ip]/v1/audio/speech #内网专线接口地址
6.2. 模型列表
请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。
模型ID | 备注 | 后端模型 |
---|---|---|
tts-1 | 通用文本转语音模型 | FishSpeech-1.5 |
tts-1-hd | 高清文本转语音模型 | ChatTTS |
6.3. 请求
curl -X 'POST' \
'https://ds-api.yovole.com/v1/audio/speech' \
-H "Content-Type: application/json" \
-H "Authorization: Bearer [秘钥请替换]" \
-d '{
"model": "tts-1-hd",
"input": "你好,欢迎使用有孚智算大模型!",
"voice": "standard"
}'
参数说明:
model
: 使用的文本转语音模型ID,例如 "tts-1-hd"input
: 待转换的文本voice
: 使用的语音模型,可选 "alloy", "echo", "fable", "onyx", "nova", "shimmer", "standard"
6.4. 响应
{
"created": 1747450758,
"data": {
"audio": "data:audio/wav;base64,UklGRiQAAABXQVZFZm10IBAAAAABAAEAQB8AAEAfAAABAAgAZGF0YYAA..."
}
}
7. 语音转文本(STT)
7.1. 接口完整地址
https://ds-api.yovole.com/v1/audio/transcriptions #专有网关接口地址
https://[ip]/v1/audio/transcriptions #内网专线接口地址
7.2. 模型列表
请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。
模型ID | 备注 |
---|---|
whisper-1 | 语音转文本模型,支持多语言语音识别 |
7.3. 请求
curl -X 'POST' \
'https://ds-api.yovole.com/v1/audio/transcriptions' \
-H "Authorization: Bearer [秘钥请替换]" \
-F "file=@/path/to/audio.wav" \
-F "model=whisper-1"
参数说明:
file
: 要上传的音频文件,需要使用@/path/to/audio.wav
指定本地文件路径。model
: 使用的语音转文本模型ID,例如 "whisper-1"。
7.4. 响应
{
"text": "你好,欢迎使用有孚智算大模型!"
}