活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      一站式智算服务平台

      一站式智算服务平台

        • 产品动态
        • 产品介绍
        • 产品定义
        • 产品优势
        • 功能特性
        • 应用场景
        • 术语解释
        • 使用限制
        • 与其他服务的关系
        • 计费说明
        • 包周期计费模式
        • 按需计费模式-卡时
        • 按需计费模式-Tokens
        • 产品退订
        • 快速入门
        • 准备工作
        • 用户指南
        • 模型广场
        • 体验中心
        • 数据工具
        • 数据处理
        • 模型定制
        • 模型精调
        • 开发机
        • 训练任务
        • 挂载目录
        • 断点续训
        • 模型服务
        • 服务接入
        • 在线服务
        • 调用监控
        • 模型工具
        • 模型评估
        • 模型压缩
        • 训推加速
        • 训练性能与加速
        • 模型的国产化适配与性能加速
        • 断点续训加速
        • 智算资产
        • 我的模型
        • 我的数据集
        • 我的镜像
        • 我的代码包
        • 管理中心
        • 成员管理
        • 资源总览
        • 调度中心
        • 设置
        • 队列管理
        • 工作空间管理
        • 模型简介
        • DeepSeek-R1
        • DeepSeek-V3
        • Baichuan2-Turbo
        • Llama3-70B-Instruct
        • Qwen2.5-72B-Instruct
        • Qwen2-72B-Instruct
        • Qwen-VL-Chat
        • TeleChat-12B
        • InternLM2-Chat-7B
        • 最佳实践
        • 专业模型训练-昇腾环境
        • 专业模型训练-英伟达环境
        • DeepSeek模型调用-快捷版
        • DeepSeek模型调用-专业版
        • 使用专属节点部署DeepSeek服务
        • NLP大模型快速微调
        • 推理服务API
        • 如何调用API
        • 接口类型列表
        • API列表
        • 错误处理
        • API
        • Chat对话API
        • Image文本生图API
        • Embeddings文本向量化API
        • 模型列表API
        • 平台OpenAPI
        • 平台功能API使用说明
        • 常见问题
        • 计费类
        • 操作类
        • 相关协议
        • 一站式智算服务平台服务协议
        • 文档下载
        • 用户使用手册
          无相关产品

          本页目录

          帮助中心一站式智算服务平台推理服务APIAPIChat对话API
          Chat对话API
          更新时间 2025-04-02 13:52:09
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2025-04-02 13:52:09
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          本文是关于Chat 对话API的详情描述。

          接口描述

          -

          描述

          接口名称

          对话

          请求路径

          https://wishub-x1.ctyun.cn/v1/chat/completions

          功能描述

          针对描述会话的消息列表,模型将返回响应

          请求参数

          请求头参数

          参数

          示例值

          描述

          Authorization

          Bearer AppKey

          鉴权信息填入AppKey。

          Content-Type

          application/json

           

          请求参数

          备注:此参数为全平台模型通用,每个模型支持的参数、参数范围可能因模型不同而有所差异,详细可见模型广场内每个模型的API文档。

          参数名称

          二级参数

          三级参数

          四级参数

          类型

          必选

          描述

          model

           

           

           

          string

          是

          模型ID。

          messages

           

           

           

          array

           

          是

           

          用户当前输入的期望模型执行指令。一个列表内多个字典,支持多轮对话。

          对话列表,每个列表项为一个message object,message object中包含用户role和content两部分信息:

          role可选值为user、assistant、system;

          role为system时,不校验content空值,且message中system只能位于开头,即messages[0]位置;

          role为user时说明是用户提问,role为assistant时说明是模型回答,而content为实际的对话内容;

          单轮/多轮对话中,最后一个message中role必须为user,content为用户输入的最新问题,其余结果除system角色外都为历史信息拼接送入

          messages中,assistant和user的role只能交替出现,assistant后只能跟user,user后只能跟assistant。

          -

          role

           

           

          string

          否

          对话角色,role类型枚举值:user、assistant、system。

          -

          content

           

           

          string/array

          是

          对话内容,内容目前有两种格式:string,array。

          string类型:表示文本对话内容。

          array类型:表示多个对话内容列表,每个列表项为一个content object,每个content object包含type、image_url、text等信息。

          type可选值为text、image_url。

          type为text时,取text字段作为对话内容。

          type为image_url时,取image_url字段作为对话内容。

          -

          -

          type

           

          string

          否

          对话内容类型,type类型枚举值: text,image_url。

          -

          -

          text

           

          string

          否

          文本对话内容,type为text时传入。

          -

          -

          image_url

           

          object

          否

          图片对话内容,type为image_url时传入。

          -

          -

          -

          url

          string

          否

          图片对话内容中的图片地址,目前可以为二进制数据的base64编码。

          frequency_penalty

           

           

           

          float

          否

          频率惩罚。它影响模型如何根据文本中词汇token的现有频率惩罚新词汇token。值大于0,会根据新标记在文本中的现有频率来惩罚新标记,从而降低模型逐字重复同一行的可能性。

          一般取值范围[-2, 2],具体取值范围、默认值需见对应模型。

          max_tokens

           

           

           

          int

          否

          最大生成长度。控制最大生成长度,超过该值则截断。

          一般取值范围(0, 2048],具体取值范围、默认值需见对应模型。

          n

           

           

           

          int

          否

          1-n个choices。

          presence_penalty

           

           

           

          float

          否

          存在惩罚。用户控制模型生成时整个序列中的重复度。

          一般取值范围[-2.0, 2.0],具体取值范围、默认值需见对应模型。

          response_format

           

           

           

          object

          否

          返回格式。

          -

          type

           

           

          string

          否

          返回格式枚举值:text,json_object。

          seed

           

           

           

          int

          否

          随机种子。用于指定推理过程的随机种子,相同的seed值可以确保推理结果的可重现性,不同的seed值会提升推理结果的随机性。

          一般取值范围(0, 9223372036854775807],具体取值范围、默认值需见对应模型。

          stop

           

           

           

          string/array

          否

          生成停止标识。当模型生成结果以stop中某个元素结尾时,停止文本生成。

          stream

           

           

           

          bool

          否

          是否以流式接口的形式返回数据。默认为False,非流式。

          stream_options

           

           

           

          object

          否

          流式选项,stream为True有效。

          -

          include_usage

           

           

          bool

          否

          是否在返回中包含usage,stream为True有效。

          取值为True时,会在流式返回的最后一个chunk里返回usage信息,并该chunk中choices列表为空。

          temperature

           

           

           

          float

          否

          温度采样。该值越高生成文本的多样性越高,该值越低生成文本的确定性越高。

          一般取值范围(0, 2),具体取值范围、默认值需见对应模型。

          top_k

           

           

           

          int

          否

          top_k 采样。取值越大,生成的随机性越高;取值越小,生成的确定性越高。

          一般取值范围[1, 100],具体取值范围、默认值需见对应模型。

          top_p

           

           

           

          float

          否

          top_p 采样。该值越高生成文本的多样性越高,该值越低生成文本的确定性越高。该值为 0 时没有随机性。

          一般取值范围(0, 1],具体取值范围、默认值需见对应模型

          user

           

           

           

          string

          否

          用户唯一身份ID。

          请求参数示例

          {
            "model": "1234567890",    // 模型ID
            "messages": [
              {
                "role": "user",
                "content": "Hello!"
              }
            ]
          }
          

          请求返回

          非流式返回

          非流式正常返回

          字段名称

          二级字段

          三级字段

          字段类型

          描述

          id

           

           

          string

          唯一标识符

          choices

           

           

          string

          choices列表

          -

          index

           

          int

          choice索引

          -

          message

           

          object

          模型生成的消息

          -

          -

          role

          string

          对话角色

          -

          -

          content

          string

          对话消息内容

          -

          finish_reason

           

          string

          模型停止生成标记的原因。

          stop: 模型生成遇到自然停止点或提供的停止序列;

          length: 达到请求中指定的最大标记数;

          content_filter:如果由于内容过滤器中的标志而省略了内容

          tool_calls/function_call: 模型调用了函数。

          created

           

           

          int

          Unix时间戳(以秒为单位)。

          model

           

           

          string

          调用的模型名称。

          object

           

           

          string

          返回的对象类型。非流式返回始终为:chat.completion

          usage

           

           

          object

          请求使用情况的统计信息。

          -

          completion_tokens

           

          int

          生成token数。

          -

          prompt_tokens

           

          int

          输入token数。

          -

          total_tokens

           

          int

          使用的token总数(prompt + completion)。

          返回结果示例

          {
            "id": "chatcmpl-123",
            "object": "chat.completion",
            "created": 1677652288,
            "model": "xxx-chat",
            "choices": [{
              "index": 0,
              "finish_reason": "stop",
              "message": {
                "role": "assistant",
                "content": "\n\nHello there, how may I assist you today?"
              }
            }],
            "usage": {
              "prompt_tokens": 9,
              "completion_tokens": 12,
              "total_tokens": 21
            }
          }
          

          非流式异常返回

          非流式异常返回时:

          ● http code 返回非200。

          ● http body 中返回 error 结构,error结构中包含code、type、message、param等信息,具体可见错误处理章节内容。

          错误结果示例

          {
            "error" : {
              "code" : "500001",
              "type" : "INVOKE_MODEL_ERROR",
              "message" : "服务接口异常,请联系管理员"
            }
          }
          

          流式返回

          流式正常返回

          字段名称

          二级字段

          三级字段

          字段类型

          描述

          id

           

           

          string

          唯一标识符

          choices

           

           

          string

          choices列表

          -

          index

           

          int

          choice索引

          -

          delta

           

          object

          模型生成的消息

          -

          -

          role

          string

          对话角色

          -

          -

          content

          string

          对话消息内容

          -

          finish_reason

           

          string

          模型停止生成标记的原因。

          stop: 模型生成遇到自然停止点或提供的停止序列;

          length: 达到请求中指定的最大标记数;

          content_filter:如果由于内容过滤器中的标志而省略了内容

          tool_calls/function_call: 模型调用了函数。

          created

           

           

          int

          Unix时间戳(以秒为单位)。

          model

           

           

          string

          调用的模型名称。

          object

           

           

          string

          返回的对象类型。流式返回始终为:chat.completion.chunk

          usage

           

           

          object

          请求使用情况的统计信息。

          仅在stream_options: {"include_usage": true}设置时显示。如果存在,则它包含一个 null 值,但最后一个块包含整个请求的token使用情况的统计信息。

          -

          completion_tokens

           

          int

          生成token数。

          -

          prompt_tokens

           

          int

          输入token数。

          -

          total_tokens

           

          int

          使用的token总数(prompt + completion)。

          返回结果示例

          {"id":"chatcmpl-123","object":"chat.completion.chunk","created":1694268190,"model":"xxx-chat", "choices":[{"index":0,"delta":{"role":"assistant"},"finish_reason":null}]}
          {"id":"chatcmpl-123","object":"chat.completion.chunk","created":1694268190,"model":"xxx-chat", "choices":[{"index":0,"delta":{"content":"Hello"},"finish_reason":null}]}
          ....
          {"id":"chatcmpl-123","object":"chat.completion.chunk","created":1694268190,"model":"xxx-chat", "choices":[{"index":0,"delta":{},"finish_reason":"stop"}]}
          
          

          stream_options.include_usage 为 True 时多返回一条包含usage流式消息。

          {"id":"chatcmpl-123","object":"chat.completion.chunk","created":1694268199,"model":"xxx-chat", "choices":[], "usage": {"prompt_tokens": 9,"completion_tokens": 120,"total_tokens": 129}}
          

          流式异常返回

          流式异常分为两种:

          ● 如果在流式请求接收处理之前发生了异常,如鉴权、参数校验等问题,与普通的非流式一样返回http code,并带有error结构。

          ● 如果在流式请求已经接收,会先对外返回流式请求连接建立的信息,此时http code为200,而在后续模型流式返回过程中发生了异常,会在流式返回的chunk返回error结构,并终止当前的流式请求。

          流式请求建立后的异常返回示例

          {"id":"chatcmpl-123","object":"chat.completion.chunk","created":1694268190,"model":"xxx-chat", "choices":[{"index":0,"delta":{"role":"assistant"},"finish_reason":null}]}
          {"id":"chatcmpl-123","object":"chat.completion.chunk","created":1694268190,"model":"xxx-chat", "choices":[{"index":0,"delta":{"content":"Hello"},"finish_reason":null}]}
          ....
          {"error":{"code":"500001","type":"INVOKE_MODEL_ERROR","message":"服务接口异常,请联系管理员"}}
          

          请求示例代码

          假设平台用户组AppKey=884c8fc4054548a7b1ca1123592f5b7,模型ID=96dcaaaaaaaaaaaa5ff55ea377831a,以此为例进行说明。
          

          curl方式请求

          curl --request POST \
            --url https://wishub-x1.ctyun.cn/v1/chat/completions \
            --header 'Accept: */*' \
            --header 'Accept-Encoding: gzip, deflate, br' \
            --header 'Authorization: Bearer 884c8fc4054548a7b1ca1123592f5b7' \
            --header 'Content-Type: application/json' \
            --data '{
                  "model": "96dcaaaaaaaaaaaa5ff55ea377831a",
                  "messages": [
                          {
                                  "role": "user",
                                  "content": "Hello"
                          }
                  ]
          }'
          

          python方式请求

          import json
          import requests
          URL = "https://wishub-x1.ctyun.cn/v1/chat/completions"
          headers = {
              "Authorization": "Bearer 884c8fc4054548a7b1ca1123592f5b7",
              "Content-Type": "application/json"
          }
          data = {
              "model": "96dcaaaaaaaaaaaa5ff55ea377831a",
              "messages": [
                  {"role": "user", "content": "Hello"}
              ],
              "stream": True
          }
          try:
              response = requests.post(URL, headers=headers, json=data, stream=True)
              if response.status_code != 200:
                  print(response.text)
              else
                  for line in response.iter_lines(chunk_size=8192, decode_unicode=True):
                      ## 处理请求
                      if line :
                          if "[DONE]" == line:
                               break
                          # 去除data前缀:
                          json_string = line.removeprefix("data:")
                          # 转为json: 
                          jsonData = json.loads(json_string)
                          # 判断是否有值
                          if "choices" in jsonData and len(jsonData["choices"][0]) > 0:
                              firstChoice = jsonData["choices"][0]
                              # 取content的逻辑
                              if "delta" in firstChoice and "content" in firstChoice["delta"] :
                                  # content内容
                                  print(firstChoice["delta"]["content"])
          except Exception as e:
              print(f"Exception: {e}")
          
          

          openai 客户端示例代码

          import openai
          from openai import OpenAI
          client = OpenAI(base_url="https://wishub-x1.ctyun.cn/v1", api_key="884c8fc4054548a7b1ca1123592f5b7")
          messages = [
              {"role": "user", "content": "Hello"}
          ]
          try:
              stream = client.chat.completions.create(
                  model="96dcaaaaaaaaaaaa5ff55ea377831a",
                  messages=messages,
                  stream=True 
              )
              # 流式
              for chunk in stream:
                  print(chunk.choices[0].delta.content or "", end="", flush=True)
          except openai.APIStatusError as e:
              print(f"APIStatusError: {e.status_code}, {e.message}, {e.body}")
          except openai.APIError as e:
              print(f"APIError: {e.body}")
          except Exception as e:
              print(f"Exception: {e}")
          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  API
          下一篇 :  Image文本生图API
          搜索 关闭
          ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2025天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明