有孚云智算-大模型api调用指南

有孚云智算-大模型API调用指南

1. 端点说明

接口均遵循openai规范，https://platform.openai.com/docs/api-reference/introduction

ds-api网关：专属的大模型网关服务，包括不限于聊天的模型，同时具有负载均衡，智能调度，流控等高级功能，主要提供API服务。
内网专线接口：也是调用的ds-api的服务，只是走的服务内网的网络，理论上速度更快，适合有孚云上有云资源的用户。

端点地址	http://ds-api.yovole.com/
端口说明	由ds-api网关提供服务，性能更好
模型列表	聊天模型，embedding模型，rerank模型，语音，问生图等
秘钥获取	API-key管理中自助创建
备注信息	签约租户,包年租户等
场景应用	独立部署渠道，企业级应用，AI集成开发

注意：端点地址对于有孚云租户支持走内网的方式，内网专线更快！

2. 聊天（chat）

2.1. 接口完整地址

https://ds-api.yovole.com/v1/chat/completions   #专有网关接口地址
https://[ip]/v1/chat/completions                #内网专线接口地址

2.2. 模型列表

请用实际里面获取到的模型ID为准，该文档仅供参考，可能信息有变更。

模型ID	备注
DeepSeek-R1	DeepSeek 系列模型
DeepSeek-R1-Distill-Qwen-32B	DeepSeek 蒸馏 Qwen-32B 模型
DeepSeek-V3	DeepSeek V3 模型
QwQ-32B	Qwen3 系列模型
Qwen2.5-72B-Instruct	Qwen2.5 72B 指令微调模型
Qwen2.5-Coder-32B-Instruct	Qwen2.5 Coder 32B 指令微调模型
Qwen2.5-VL-32B-Instruct	Qwen2.5 VL 32B 指令微调模型
Qwen2.5-VL-72B-Instruct	Qwen2.5 VL 72B 指令微调模型
Qwen3-14B	Qwen3 14B 模型
Qwen3-30B-A3B	Qwen3 30B A3B 模型
Qwen3-32B	Qwen3 32B 模型
nim.deepseek-r1-distill-llama-8b	nim 系列 DeepSeek R1 Distill Llama 8B
nim.llama-3.3-70b-instruct	nim 系列 Llama 3.3 70B 指令微调模型
nim.llama3.2-11b-vl-instruct	nim 系列 Llama3.2 11B VL 指令微调模型
nim.qwen-2.5-7b-instruct	nim 系列 Qwen 2.5 7B 指令微调模型
Qwen3-Next-80B-A3B-Instruct	Qwen3 Next 80B A3B 指令微调模型
gpt-oss-120b	GPT OSS 120B 模型
glm-4.6	GLM 4.6 模型
kimi-k2-instruct	Kimi K2 指令微调模型
qwen3-coder-plus	Qwen3 Coder Plus 编程模型

2.3. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/v1/chat/completions' \
  -H 'Content-Type: application/json' \
  -H "Authorization: Bearer [秘钥请替换]" \
  -d '{
    "model": "DeepSeek-V3",
    "messages": [
      {
        "role":"user",
        "content":"你是谁！"
      }
    ],
    "top_p": 1,
    "n": 1,
    "max_tokens": 5500,
    "stream": false,
    "frequency_penalty": 1.0,
    "stop": ["hello"]
  }' | jq

参数说明：

model: 使用的模型ID，例如 "DeepSeek-V3"
messages: 输入的消息列表，包含角色（role）和内容（content）。role 可选 "user", "system", "assistant"
top_p: 控制生成文本的多样性，取值范围 0-1，1 表示完全随机，0 表示贪婪策略
n: 生成的候选响应数量
max_tokens: 生成文本的最大长度
stream: 是否以流式方式接收响应，布尔值
frequency_penalty: 对重复 token 的惩罚，越大越不容易重复

stop: 停止生成的 token 列表

2.4. 响应

{
"id": "chatcmpl-716224c7642c41a38098393112a9f378",
"object": "chat.completion",
"created": 1747453469,
"model": "DeepSeek-V3",
"choices": [
  {
    "index": 0,
    "message": {
      "role": "assistant",
      "reasoning_content": null,
      "content": "我是DeepSeek Chat，由深度求索公司研发的智能AI助手！✨ 我可以帮你解答各种问题、提供知识支持、陪你聊天，还能帮你整理文档、分析数据等等。如果有什么想知道的，尽管问我吧！😊  \n\n你是对AI感兴趣，还是有什么具体的问题需要帮助呢？",
      "tool_calls": []
    },
    "logprobs": null,
    "finish_reason": "stop",
    "stop_reason": null
  }
],
"usage": {
  "prompt_tokens": 5,
  "total_tokens": 72,
  "completion_tokens": 67,
  "prompt_tokens_details": null
},
"prompt_logprobs": null
}

3. 文生图（text2img）

3.1. 接口完整地址

https://ds-api.yovole.com/v1/images/generations        #专有网关接口地址
https://[ip]/v1/images/generations                    #内网专线接口地址

3.2. 模型列表

请用实际里面获取到的模型ID为准，该文档仅供参考，可能信息有变更。

模型ID	备注
FLUX.1-dev	生成图片模型，用于生成高质量的图片
HunyuanDiT	智能AI助手模型，用于文本生成、对话和知识分享

3.3. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/v1/images/generations' \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer [秘钥请替换]" \
  -d '{
    "prompt": "a cute cat",
    "n": 1,
    "size": "1024x1024",
    "model": "FLUX.1-dev",
    "response_format": "b64_json"           #只能选b64_json
  }'

参数说明：

prompt: 生成图片的文本描述
n: 生成的图片数量
size: 生成图片的尺寸，可选 "1024x1024", "1024x1792", "1792x1024"
model: 使用的图片生成模型ID，例如 "FLUX.1-dev"
response_format: 响应格式，目前只支持 "b64_json"，表示返回base64的图片。

3.4. 响应

{
  "created": 1747450758,
  "data": [
    {
      "url": null,
      "b64_json": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAA..."
    }
  ]
}

4. 向量嵌入（embedding）

4.1. 接口完整地址

https://ds-api.yovole.com/v1/embeddings        #专有网关接口地址
https://[ip]/v1/embeddings                    #内网专线接口地址

4.2. 模型列表

请用实际里面获取到的模型ID为准，该文档仅供参考，可能信息有变更。

模型ID	备注
bge-m3	文本嵌入模型，用于将文本转换为向量表示

4.3. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/v1/embeddings' \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer [秘钥请替换]" \
  -d '{
    "input": "Your text string goes here",
    "model": "bge-m3"
  }'

参数说明：

input: 用于生成嵌入向量的文本或文本列表
model: 使用的文本嵌入模型ID，例如 "bge-m3"

4.4. 响应

{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "embedding": [0.123, 0.456, ...],
      "index": 0
    }
  ],
  "model": "bge-m3",
  "usage": {
    "prompt_tokens": 5,
    "total_tokens": 5
  }
}

5. 排序模型（rerank）

5.1. 模型列表

请用实际里面获取到的模型ID为准，该文档仅供参考，可能信息有变更。

模型ID	备注	接口地址
bce-reranker-base-v1	rerank排序模型，百度语义相关性模型	https://ds-api.yovole.com/reranker/v1/rerank #专有网关接口地址 https://[ip]/reranker/v1/rerank #内网专线接口地址
bge-reranker-v2-m3	rerank排序模型，推荐，效果更优	https://ds-api.yovole.com/reranker/v2/rerank #专有网关接口地址 https://[ip]/reranker/v2/rerank #内网专线接口地址

5.2. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/reranker/v2/rerank' \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer [秘钥请替换]" \
  -d '{"query": "iphone", "documents": ["我买了个苹果，好吃的","苹果树，香蕉树，桃子树", "苹果手机", "新款手机"]}'

参数说明：

model: 使用的 rerank 模型ID，例如 "bge-reranker-v2-m3"
query: 用于排序的查询文本
documents: 待排序的文本列表

5.3. 响应

{
  "id": "rerank-bab5a4874aac4839ab4304d47050fba5",
  "model": "bge-reranker-v2-m3",
  "usage": {
    "total_tokens": 43
  },
  "results": [
    {
      "index": 2,
      "document": {
        "text": "苹果手机"
      },
      "relevance_score": 0.97802734375
    },
    {
      "index": 3,
      "document": {
        "text": "新款手机"
      },
      "relevance_score": 0.69921875
    },
    {
      "index": 0,
      "document": {
        "text": "我买了个苹果，好吃的"
      },
      "relevance_score": 0.07275390625
    },
    {
      "index": 1,
      "document": {
        "text": "苹果树，香蕉树，桃子树"
      },
      "relevance_score": 0.0031108856201171875
    }
  ]
}

6. 文本转语音（TTS）

6.1. 接口完整地址

https://ds-api.yovole.com/v1/audio/speech      #专有网关接口地址
https://[ip]/v1/audio/speech                  #内网专线接口地址

6.2. 模型列表

请用实际里面获取到的模型ID为准，该文档仅供参考，可能信息有变更。

模型ID	备注	后端模型
tts-1	通用文本转语音模型	FishSpeech-1.5
tts-1-hd	高清文本转语音模型	ChatTTS

6.3. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/v1/audio/speech' \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer [秘钥请替换]" \
  -d '{
    "model": "tts-1-hd",
    "input": "你好，欢迎使用有孚智算大模型！",
    "voice": "standard"
  }'

参数说明：

model: 使用的文本转语音模型ID，例如 "tts-1-hd"
input: 待转换的文本
voice: 使用的语音模型，可选 "alloy", "echo", "fable", "onyx", "nova", "shimmer", "standard"

6.4. 响应

{
  "created": 1747450758,
  "data": {
    "audio": "data:audio/wav;base64,UklGRiQAAABXQVZFZm10IBAAAAABAAEAQB8AAEAfAAABAAgAZGF0YYAA..."
  }
}

7. 语音转文本（STT）

7.1. 接口完整地址

https://ds-api.yovole.com/v1/audio/transcriptions #专有网关接口地址
https://[ip]/v1/audio/transcriptions          #内网专线接口地址

7.2. 模型列表

请用实际里面获取到的模型ID为准，该文档仅供参考，可能信息有变更。

模型ID	备注
whisper-1	语音转文本模型，支持多语言语音识别

7.3. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/v1/audio/transcriptions' \
  -H "Authorization: Bearer [秘钥请替换]" \
  -F "file=@/path/to/audio.wav" \
  -F "model=whisper-1"

参数说明：

file: 要上传的音频文件，需要使用 @/path/to/audio.wav 指定本地文件路径。
model: 使用的语音转文本模型ID，例如 "whisper-1"。

7.4. 响应

{
  "text": "你好，欢迎使用有孚智算大模型！"
}

有孚云智算-大模型api调用指南

有孚云智算-大模型API调用指南

1. 端点说明

2. 聊天（chat）

2.1. 接口完整地址

2.2. 模型列表

2.3. 请求

参数说明：

2.4. 响应

3. 文生图（text2img）

3.1. 接口完整地址

3.2. 模型列表

3.3. 请求

参数说明：

3.4. 响应

4. 向量嵌入（embedding）

4.1. 接口完整地址

4.2. 模型列表

4.3. 请求

参数说明：

4.4. 响应

5. 排序模型（rerank）

5.1. 模型列表

5.2. 请求

参数说明：

5.3. 响应

6. 文本转语音（TTS）

6.1. 接口完整地址

6.2. 模型列表

6.3. 请求

参数说明：

6.4. 响应

7. 语音转文本（STT）

7.1. 接口完整地址

7.2. 模型列表

7.3. 请求

参数说明：

7.4. 响应

个结果匹配 ""

无结果匹配 ""