概述
阿里巴巴开源新一代通义千问模型Qwen3,参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。Qwen3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。
本最佳实践在算力互联调度平台的应用市场中,您可快速部署应用,并对外提供API调用服务,方便您即刻体验,开箱即用。
前置说明
该文档为算力互联调度平台控制台通过应用市场以推理api形态体验 Qwen3的说明,通过算力互联调度平台控制台,打开应用市场,创建对应的Qwen3推理api应用,使用 web 界面和 Qwen3 推理对话,Qwen3推理api应用支持8b、14b、30b、32b不同参数量的模型体验。
本产品中的模型由第三方主体提供,尽管云公司已尽最大努力进行识别和维护,但仍无法保证模型的可用性。请客户按照该产品的服务协议使用该产品,做好甄别并对自行选择的服务负责。
使用前准备
天翼云账号注册
使用算力互联调度平台须具备天翼云官网账号。已有天翼云账号的直接登录即可,如无天翼云账号需先注册,注册流程可参考:注册账号。
使用前提
(1)如需使用服务请先完成实名认证,请参考账号中心-实名认证。
(2)如需使用按需服务,请确认账号余额≥100 元。
操作指引
部署应用
订购应用
在应用市场页面,选择Qwen3(API)应用,点击【查看】,进入应用部署页面。
点击【立即订购】,勾选同意用户协议,支付订单,即可完成Qwen3(API)模型推理服务部署。
服务详情查看
进入算力互联调度平台租户控制台。
选择【通用服务】->【应用管理】->【应用列表】,进入应用列表页面。刷新应用列表,等待新创建的应用进入到【运行中】状态后点击右侧操作栏【应用详情】。
进入应用详情页面,点击【去管理应用实例】。
进入服务实例详情页面,可查看Qwen3推理服务API调用地址。
服务调用
使用python代码调用api接口
获取API调用方式
a. API调用地址(base_url):在算力互联调度平台-智能计算控制台,进入【分布式推理】-【详情】,在资源配置模块,获取"调用地址”,“调用地址”拼接"/v1"即为API调用地址。
b.API认证(api_key):在算力互联调度平台-智能计算控制台,进入【分布式推理】-【详情】,在资源配置模块,获取环境变量中的api_key。
准备python代码
from openai import OpenAI import httpx c = httpx.Client() client = OpenAI( base_url='', # 调用地址/v1/ api_key='' # 环境变量中的API_KEY, http_client=c ) stream=False completion = client.chat.completions.create( messages=[ { 'role': 'user', 'content': '你是谁', } ], model="qwen3:32b", stream=stream ) if stream: output_text = '' for chunk in completion: # print(chunk.choices[0].delta.content,end='') print(chunk.choices[0].delta.content or "", end="") content= chunk.choices[0].delta.content if content: # 检查 content 是否为 None output_text +=content print('\n','*'*100) print('接收到内容:\n',output_text) else: print(completion) print(completion.choices[0].message)
执行python代码,Qwen3将给出答复
使用anythingllm连接api服务
下载anythingllm桌面端程序并安装。
打开anythingllm程序,选择模型提供方【Generic OpenAI】。
输入baseURL:”调用地址/v1/“,APIKey:“环境变量中的API_KEY”,Chat Model Name:“qwen3:32b”,Token context windows大小,完成模型提供方配置。
输入问题,并发送问题,Qwen3将给出答复。
使用Dify v1.0.0连接api服务
部署dify v1.0.0,选择OpenAI-API-compatible插件进行安装。
点击系统配置,添加模型。
输入API endpoint URL:”调用地址/v1/“,API Key:“环境变量中的API_KEY”,API endpoint中的模型名称:“qwen3:32b”,完成模型提供方配置。
返回工作室,创建空白应用。
选择聊天助手,输入应用名称,提交创建。
输入问题,并发送问题,Qwen3将给出答复。