有孚云智算-大模型api调用指南

有孚云智算-大模型API调用指南

1. 端点说明

接口均遵循openai规范,https://platform.openai.com/docs/api-reference/introduction

ds-api网关:专属的大模型网关服务,包括不限于聊天的模型,同时具有负载均衡,智能调度,流控等高级功能,主要提供API服务。
内网专线接口:也是调用的ds-api的服务,只是走的服务内网的网络,理论上速度更快,适合有孚云上有云资源的用户。
端点地址 http://ds-api.yovole.com/
端口说明 由ds-api网关提供服务,性能更好
模型列表 聊天模型,embedding模型,rerank模型,语音,问生图等
秘钥获取 API-key管理中自助创建
备注信息 签约租户,包年租户等
场景应用 独立部署渠道,企业级应用,AI集成开发

注意:端点地址对于有孚云租户支持走内网的方式,内网专线更快!

2. 聊天(chat)

2.1. 接口完整地址

https://ds-api.yovole.com/v1/chat/completions   #专有网关接口地址
https://[ip]/v1/chat/completions                #内网专线接口地址

2.2. 模型列表

请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。

模型ID 备注
DeepSeek-R1 DeepSeek 系列模型
DeepSeek-R1-Distill-Qwen-32B DeepSeek 蒸馏 Qwen-32B 模型
DeepSeek-V3 DeepSeek V3 模型
QwQ-32B Qwen3 系列模型
Qwen2.5-72B-Instruct Qwen2.5 72B 指令微调模型
Qwen2.5-Coder-32B-Instruct Qwen2.5 Coder 32B 指令微调模型
Qwen2.5-VL-32B-Instruct Qwen2.5 VL 32B 指令微调模型
Qwen2.5-VL-72B-Instruct Qwen2.5 VL 72B 指令微调模型
Qwen3-14B Qwen3 14B 模型
Qwen3-30B-A3B Qwen3 30B A3B 模型
Qwen3-32B Qwen3 32B 模型
nim.deepseek-r1-distill-llama-8b nim 系列 DeepSeek R1 Distill Llama 8B
nim.llama-3.3-70b-instruct nim 系列 Llama 3.3 70B 指令微调模型
nim.llama3.2-11b-vl-instruct nim 系列 Llama3.2 11B VL 指令微调模型
nim.qwen-2.5-7b-instruct nim 系列 Qwen 2.5 7B 指令微调模型
Qwen3-Next-80B-A3B-Instruct Qwen3 Next 80B A3B 指令微调模型
gpt-oss-120b GPT OSS 120B 模型
glm-4.6 GLM 4.6 模型
kimi-k2-instruct Kimi K2 指令微调模型
qwen3-coder-plus Qwen3 Coder Plus 编程模型

2.3. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/v1/chat/completions' \
  -H 'Content-Type: application/json' \
  -H "Authorization: Bearer [秘钥请替换]" \
  -d '{
    "model": "DeepSeek-V3",
    "messages": [
      {
        "role":"user",
        "content":"你是谁!"
      }
    ],
    "top_p": 1,
    "n": 1,
    "max_tokens": 5500,
    "stream": false,
    "frequency_penalty": 1.0,
    "stop": ["hello"]
  }' | jq

参数说明:

  • model: 使用的模型ID,例如 "DeepSeek-V3"
  • messages: 输入的消息列表,包含角色(role)和内容(content)。role 可选 "user", "system", "assistant"
  • top_p: 控制生成文本的多样性,取值范围 0-1,1 表示完全随机,0 表示贪婪策略
  • n: 生成的候选响应数量
  • max_tokens: 生成文本的最大长度
  • stream: 是否以流式方式接收响应,布尔值
  • frequency_penalty: 对重复 token 的惩罚,越大越不容易重复
  • stop: 停止生成的 token 列表

    2.4. 响应

    {
    "id": "chatcmpl-716224c7642c41a38098393112a9f378",
    "object": "chat.completion",
    "created": 1747453469,
    "model": "DeepSeek-V3",
    "choices": [
      {
        "index": 0,
        "message": {
          "role": "assistant",
          "reasoning_content": null,
          "content": "我是DeepSeek Chat,由深度求索公司研发的智能AI助手!✨ 我可以帮你解答各种问题、提供知识支持、陪你聊天,还能帮你整理文档、分析数据等等。如果有什么想知道的,尽管问我吧!😊  \n\n你是对AI感兴趣,还是有什么具体的问题需要帮助呢?",
          "tool_calls": []
        },
        "logprobs": null,
        "finish_reason": "stop",
        "stop_reason": null
      }
    ],
    "usage": {
      "prompt_tokens": 5,
      "total_tokens": 72,
      "completion_tokens": 67,
      "prompt_tokens_details": null
    },
    "prompt_logprobs": null
    }
    

3. 文生图(text2img)

3.1. 接口完整地址

https://ds-api.yovole.com/v1/images/generations        #专有网关接口地址
https://[ip]/v1/images/generations                    #内网专线接口地址

3.2. 模型列表

请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。

模型ID 备注
FLUX.1-dev 生成图片模型,用于生成高质量的图片
HunyuanDiT 智能AI助手模型,用于文本生成、对话和知识分享

3.3. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/v1/images/generations' \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer [秘钥请替换]" \
  -d '{
    "prompt": "a cute cat",
    "n": 1,
    "size": "1024x1024",
    "model": "FLUX.1-dev",
    "response_format": "b64_json"           #只能选b64_json
  }'

参数说明:

  • prompt: 生成图片的文本描述
  • n: 生成的图片数量
  • size: 生成图片的尺寸,可选 "1024x1024", "1024x1792", "1792x1024"
  • model: 使用的图片生成模型ID,例如 "FLUX.1-dev"
  • response_format: 响应格式,目前只支持 "b64_json",表示返回base64的图片。

3.4. 响应

{
  "created": 1747450758,
  "data": [
    {
      "url": null,
      "b64_json": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAA..."
    }
  ]
}

4. 向量嵌入(embedding)

4.1. 接口完整地址

https://ds-api.yovole.com/v1/embeddings        #专有网关接口地址
https://[ip]/v1/embeddings                    #内网专线接口地址

4.2. 模型列表

请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。

模型ID 备注
bge-m3 文本嵌入模型,用于将文本转换为向量表示

4.3. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/v1/embeddings' \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer [秘钥请替换]" \
  -d '{
    "input": "Your text string goes here",
    "model": "bge-m3"
  }'

参数说明:

  • input: 用于生成嵌入向量的文本或文本列表
  • model: 使用的文本嵌入模型ID,例如 "bge-m3"

4.4. 响应

{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "embedding": [0.123, 0.456, ...],
      "index": 0
    }
  ],
  "model": "bge-m3",
  "usage": {
    "prompt_tokens": 5,
    "total_tokens": 5
  }
}

5. 排序模型(rerank)

5.1. 模型列表

请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。

模型ID 备注 接口地址
bce-reranker-base-v1 rerank排序模型,百度语义相关性模型 https://ds-api.yovole.com/reranker/v1/rerank #专有网关接口地址
https://[ip]/reranker/v1/rerank #内网专线接口地址
bge-reranker-v2-m3 rerank排序模型,推荐,效果更优 https://ds-api.yovole.com/reranker/v2/rerank #专有网关接口地址
https://[ip]/reranker/v2/rerank #内网专线接口地址

5.2. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/reranker/v2/rerank' \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer [秘钥请替换]" \
  -d '{"query": "iphone", "documents": ["我买了个苹果,好吃的","苹果树,香蕉树,桃子树", "苹果手机", "新款手机"]}'

参数说明:

  • model: 使用的 rerank 模型ID,例如 "bge-reranker-v2-m3"
  • query: 用于排序的查询文本
  • documents: 待排序的文本列表

5.3. 响应

{
  "id": "rerank-bab5a4874aac4839ab4304d47050fba5",
  "model": "bge-reranker-v2-m3",
  "usage": {
    "total_tokens": 43
  },
  "results": [
    {
      "index": 2,
      "document": {
        "text": "苹果手机"
      },
      "relevance_score": 0.97802734375
    },
    {
      "index": 3,
      "document": {
        "text": "新款手机"
      },
      "relevance_score": 0.69921875
    },
    {
      "index": 0,
      "document": {
        "text": "我买了个苹果,好吃的"
      },
      "relevance_score": 0.07275390625
    },
    {
      "index": 1,
      "document": {
        "text": "苹果树,香蕉树,桃子树"
      },
      "relevance_score": 0.0031108856201171875
    }
  ]
}

6. 文本转语音(TTS)

6.1. 接口完整地址

https://ds-api.yovole.com/v1/audio/speech      #专有网关接口地址
https://[ip]/v1/audio/speech                  #内网专线接口地址

6.2. 模型列表

请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。

模型ID 备注 后端模型
tts-1 通用文本转语音模型 FishSpeech-1.5
tts-1-hd 高清文本转语音模型 ChatTTS

6.3. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/v1/audio/speech' \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer [秘钥请替换]" \
  -d '{
    "model": "tts-1-hd",
    "input": "你好,欢迎使用有孚智算大模型!",
    "voice": "standard"
  }'

参数说明:

  • model: 使用的文本转语音模型ID,例如 "tts-1-hd"
  • input: 待转换的文本
  • voice: 使用的语音模型,可选 "alloy", "echo", "fable", "onyx", "nova", "shimmer", "standard"

6.4. 响应

{
  "created": 1747450758,
  "data": {
    "audio": "data:audio/wav;base64,UklGRiQAAABXQVZFZm10IBAAAAABAAEAQB8AAEAfAAABAAgAZGF0YYAA..."
  }
}

7. 语音转文本(STT)

7.1. 接口完整地址

https://ds-api.yovole.com/v1/audio/transcriptions #专有网关接口地址
https://[ip]/v1/audio/transcriptions          #内网专线接口地址

7.2. 模型列表

请用实际里面获取到的模型ID为准,该文档仅供参考,可能信息有变更。

模型ID 备注
whisper-1 语音转文本模型,支持多语言语音识别

7.3. 请求

curl -X 'POST' \
  'https://ds-api.yovole.com/v1/audio/transcriptions' \
  -H "Authorization: Bearer [秘钥请替换]" \
  -F "file=@/path/to/audio.wav" \
  -F "model=whisper-1"

参数说明:

  • file: 要上传的音频文件,需要使用 @/path/to/audio.wav 指定本地文件路径。
  • model: 使用的语音转文本模型ID,例如 "whisper-1"。

7.4. 响应

{
  "text": "你好,欢迎使用有孚智算大模型!"
}

个结果匹配 ""

    无结果匹配 ""