活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 聚力AI赋能 天翼云大模型专项 大模型特惠专区·Token Plan 轻享包低至9.9元起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 企业出海解决方案 NEW 助力您的业务扬帆出海,通达全球!
  • 天翼云信创专区 NEW “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
星辰TokenHub
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V4-Flash
  • GLM-5.1
  • Qwen3.5-122B-A10B
  • DeepSeek-V3.2(旗舰版)
  • GLM-5(正式版)
智算一体机
  • 智算一体机
智能体引擎
  • 智能体引擎
可信数据空间
  • 可信数据空间
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2026智能云生态大会
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      星辰MaaS模型服务平台

      星辰MaaS模型服务平台

      • 星辰MaaS模型服务平台

      无数据

        • 产品介绍
        • 产品定义
        • 产品优势
        • 术语解释
        • 模型使用限制
        • 计费说明
        • 模型推理计费规则
        • 模型训推计费规则
        • 欠费说明
        • 账单和发票
        • 快速入门
        • 准备工作
        • 快速入门
        • 用户指南
        • 模型广场
        • 体验中心
        • 数据管理
        • 公共数据集
        • 我的数据集
        • 模型推理
        • 模型训练
        • 模型调优
        • 我的模型
        • 模型部署
        • 服务部署
        • 模型量化
        • 系统管理
        • API Key
        • 操作日志
        • 常见问题
        • 常见问题
        • 最佳实践
        • 零门槛CV大模型训推
        • API参考
        • 开发指南
        • 开发指南
        • 异步调用结果获取
        • 大模型异步调用结果回查
        • 状态码说明
        • 实时超自然语音合成-普通话版
        • 能力介绍
        • 接口文档
        • 超多方言实时语音识别
        • 能力介绍
        • 接口文档
        • 通用问答版大模型-36B
        • 能力介绍
        • 接口文档
        • 对话大模型
        • 能力介绍
        • 接口文档
        • 文生图大模型
        • 能力介绍
        • 接口文档
        • 图生图大模型
        • 能力介绍
        • 接口文档
        • 文档下载
        • 相关协议
        • 星辰MaaS模型推理服务协议
        • 星辰MaaS模型推理服务用户信息处理规则
        • 生成式人工智能服务备案信息参考
        • 星辰MaaS模型定制开发服务协议
          无相关产品

          本页目录

          帮助中心 星辰MaaS模型服务平台 API参考 超多方言实时语音识别 接口文档
          接口文档
          更新时间 2026-06-11 10:19:10
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2026-06-11 10:19:10
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接

          接口信息

          API Path 

          /aipaas/voice/v1/asr/fy

          请求协议 

          WS

          建立连接时的请求参数(websocket open):

          请求头部:

          头部标签必填说明类型数据字典限制头部内容示例
          Content-Type是application/json[string]--application/jsonapplication/json
          X-APP-ID是系统管理--API Key,创建应用获取AppID 和AppKey,公网鉴权,公网调用时必传[string]----
          Device-Uuid否设备管理-设备uuid[string]----
          Authorization是鉴权信息[string]----

          请求参数 

          Json Object

          参数名说明必填类型数据字典限制示例
          option语音识别配置可选项,客户端发送开始识别请求时,根据具体需求,配置该字段否[object]---
          option>>sample_rate音频采样率,默认值16000Hz否[int]---
          option>>enable_punctuation是否加标点,默认:是,若开启,则在rec_status为3时给识别文本增加标点否[boolean]---
          option>>enableinversetext_normalization是否开启 ITN,默认:是,若开启,则在rec_status为3时对识别文本进行逆文本规范化否[boolean]---
          option>>enable_emendation是否开启校勘,默认:否,若开启,则在rec_status为3时对识别文本进行校准否[boolean]---
          option>>enable_words是否开启返回词信息,默认:否,若开启,则同时返回字级别时间戳否[boolean]---
          option>>enable_s2t是否返回繁体中文,默认值是 false否[boolean]---
          option>>province(V3.2.0删除)仅对来自电信万号的业务开放(预留字段)否[string]---
          option>>hotwords热词列表,string数组否[array]---
          option>>hotwordlistid热词列表查询ID(在热词服务创建热词表后得到热词列表查询ID,ASR服务使用此ID查询生效)否[string]---
          option>>bannedwordlist_id敏感词列表查询ID(在敏感词服务创建敏感词列表后得到敏感词列表查询ID,ASR服务使用此ID查询生效)否[string]---
          option>>maxendsilence句尾静音阈值,单位ms(仅当服务使用普通vad时生效)否[int]---
          option>>format音频格式,支持pcm、opus,默认值是pcm,传入其它值会报错(opus格式需要明确是ogg封装的opus格式)否[string]---
          req_id请求全局唯一id,记录该值便于排查问题【发送开始识别rec_status=0时必填】是[string]---
          rec_status识别状态 0:开始识别; 1:发送语音流; 2:结束语音流;是[int]---
          audio_stream发送语音流时必填。语音流,采用 base64 编码否[string]---
          响应报文:------

          返回结果

          成功 (200) Json Object

          参数名说明必填类型数据字典限制示例
          code返回码是[int]--10000
          message返回码描述是[string]--success
          sid会话全局唯一 id,用于记录本次会话是[string]--aae36140-bc13-441f-81f9-6700fe7a5e96
          res_status响应状态 0:识别就绪; 1:识别到有效语音开始; 2:如果开启了返回中间结果, 则返回中间识别结果; 3:检测到一段有效语音结束,返回该段语音的识别结果; 4:处理完所有的音频数据,返回尚未返回的识别结果(如果有);是[int]--2
          elps_time当前识别结果所对应的已处理的音频总时长,单位是毫秒否[int]---
          data识别结果,服务端接收到语音流后返回是[object]---
          data>>sn句子编号,从 0开始否[int]---
          data>>results当前句子识别结果,如果开启 object.nbest ,则返回多个结果否[array]---
          data>>results>>text句子识别结果否[string]---
          data>>results>>begin_time句子开始时间,单位是毫秒否[int]---
          data>>results>>end_time句子结束时间,单位是毫秒否[int]---
          data>>results>>loudness句子音量,仅在一句话结束即res_status=3时返回否[float]---
          data>>results>>speed句子语速,仅在一句话结束即res_status=3时返回否[float]---
          data>>results>>pitch句子语调,仅在一句话结束即res_status=3时返回否[float]---
          data>>results>>lang当前方言种类,仅在Sensevoice模型二刷时有效,仅在状态3有效否[string]---
          data>>results>>words当前句子的词信息否[array]---
          data>>results>>words>>text词信息否[string]---
          data>>results>>words>>begin_time词开始时间,单位是毫秒否[int]---
          data>>results>>words>>end_time词结束时间,单位是毫秒否[int]---

           

          能力简介

          多方言实时语音识别是指能够同时处理多种方言的语音识别系统。这种系统可以实现在不同方言之间进行实时转换和识别,广泛应用于多语言环境下的语音交互场景。

          • 音频属性:采样率8k/16k/其他常见采样率,位宽 16 bit,单声道

          • 音频格式:PCM 音频流

          • 字符编码:UTF-8

          • 响应格式:统一采用 JSON 格式

          • 音频格式:PCM音频流,0GG封装的opus音频流

          服务鉴权

          服务接口调用时需要严格遵循服务鉴权规则,服务调用鉴权规则请参见:开发指南 - 签名认证方式。

          鉴权状态码

          code说明错误描述信息解决方法
          101成功{"message":"success"}成功,开始语音识别
          4002并发超过限制{"message":"server overflow"}联系商务,增加并发
          4004授权失败{"message":"invalid license"}联系运维人员生成有效license

          请求示例

          开始识别

          客户端发送开始识别请求,需要通过请求body带语音识别过程中的可选配置参数,示例:

          {
              "option": {
                  "sample_rate": 16000,
                  "enable_punctuation": true,
                  "enable_inverse_text_normalization": true
              },
              "req_id": "aae36140-bc13-441f-81f9-6700fe7a5e96",
              "rec_status": 0
          }

          响应结果

          {
              "code": 10000,
              "message": "success",
              "sid": "aae36140-bc13-441f-81f9-6700fe7a5e96",
              "res_status": 0
          }

          发送语音流

          客户端接收到服务端发送的确认识别请求有效的响应后,开始发送语音流数据,请求body各参数含义如下:

          名称类型必需说明
          rec_statusint是识别状态
          0:开始识别;
          1:发送语音流;
          2:结束语音流;
          audio_streamstring是语音流,采用 base64 编码

          示例:

          {
           "rec_status":1,
           "audio_stream":"000asraae361406700fe7a5e9681f956210b5f1270"
          }

          接收识别结果

          客户端接收到服务端发送的确认检测请求有效的响应后,开始持续接收识别结果。

          {
              "code": 10000,
              "message": "success",
              "sid": "aae36140-bc13-441f-81f9-6700fe7a5e96",
              "res_status": 2,
              "data": {
                  "sn": 1,
                  "results": [{
                      "lang": "zh",
                      "text": "你好今天",
                      "begin_time": 1500,
                      "end_time": 2800,
                      "words": [
                          {
                              "text": "你",
                              "begin_time": 50,
                              "end_time": 70
                          },
                          {
                              "text": "好",
                              "begin_time": 50,
                              "end_time": 70
                          },
                          {
                              "text": "今",
                              "begin_time": 50,
                              "end_time": 70
                          },
                          {
                              "text": "天",
                              "begin_time": 50,
                              "end_time": 70
                          }
                      ]
                  }]
              }
          }

          结束语音流

          客户端语音流发送完成,结束语音流,请求body各参数含义如下:

          名称类型必需说明
          rec_statusint是识别状态
          0:开始识别;
          1:发送语音流;
          2:结束语音流;

          示例:

          {
              "rec_status": 2
          }

          关闭连接

          客户端如果不需要继续进行语音识别,则立即关闭websocket 连接(避免占用资源),如果需要继续进行语音识别(多轮对话场景),需要从开始识别状态开始,按照上述步骤依次执行

          状态码说明

          状态码解释说明解决方法
          10000success成功执行下一步操作
          20003Banned word(s) detected in input敏感词命中成功,并检测到敏感词
          10001parse request body failURL body 格式不对查看请求的 URL body 格式是否正确,参考接口文档
          10002session not found会话id查询失败检查客户端发送的请求,通常是因为没有发送开始识别请求
          10003required parameter miss参数缺失检查接口文档,补全入参
          10004duplicated session id会话id重复检查客户端发送的请求,通常是因为重复发送开始识别请求
          10005worker pool overflow超并发联系研发人员进行排查
          10006unknown error未知错误联系研发人员进行排查
          10007Non-real-time audio data非实时音频数据检查发送的音频数据是否与每次发送间隔的时间一致,比如每200ms发送200ms的音频数据
          10008Session not begun尚未发送开始识别标志检查是否发送开始识别标志
          10009Session is running重复发送开始识别标志检查是否重复发送开始识别标志,若重复,请先发送结束识别标志
          10010Hotword list load failed热词表查询失败检查X-APP-ID,热词表ID是否有错误,检查热词查询服务是否有错误
          10011Banned Word List Loads failed敏感词表查询失败检查X-APP-ID,敏感词ID是否有错误,检查敏感词查询服务是否有错误
          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  能力介绍
          下一篇 :  通用问答版大模型-36B
          搜索 关闭
          ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2026天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明