可视化大屏开发工具_可视化大屏开发工具文档介绍内容-天翼云

如何获取AKSK
本文带您快速熟悉如何获取访问密钥(AK/SK)。访问密钥即AK/SK（Access Key ID/Secret Access Key），是您通过开发工具（API、SDK）访问部分云服务平台时的身份凭证，不能登录控制台。系统通过AK识别访问用户的身份，通过SK进行签名验证，通过加密签名验证可以确保请求的机密性、完整性和请求者身份的正确性。获取AKSK操作说明 1. 通过实名认证的账号登录天翼云。 2. 进入天翼云账号中心。 3. 点击【安全设置】进入安全设置中心 4. 在用户AccessKey模块，可创建AKSK，或直接查看已生成的AKSK。

来自：
帮助文档
云监控服务
最佳实践
如何获取AKSK
API列表
平台提供了以下大模型API能力。模型名称模型简介模型ID DeepSeekR1昇腾版 DeepSeekR1是一款具有671B参数大小的创新性大语言模型，由杭州深度求索人工智能基础技术研究有限公司开发。该模型基于 transformer 架构，通过对海量语料数据进行预训练，结合注意力机制，能够理解和生成自然语言。它经过监督微调、人类反馈的强化学习等技术进行对齐，具备语义分析、计算推理、问答对话、篇章生成、代码编写等多种能力。R1 模型在多个 NLP 基准测试中表现出色，具备较强的泛化能力和适应性。 4bd107bff85941239e27b1509eccfe98 DeepSeekR1昇腾版2 DeepSeekR1是一款具有671B参数大小的创新性大语言模型，该模型基于 transformer 架构，通过对海量语料数据进行预训练，结合注意力机制，经过监督微调、人类反馈的强化学习等技术进行对齐，具备语义分析、计算推理、问答对话、篇章生成、代码编写等多种能力。R1 模型在多个 NLP 基准测试中表现出色，具备较强的泛化能力和适应性。 7ba7726dad4c4ea4ab7f39c7741aea68 DeepSeekV3昇腾版 DeepSeekV3是DeepSeek团队开发的新一代专家混合（MoE）语言模型，共有671B参数，在14.8万亿个Tokens上进行预训练。该模型采用多头潜在注意力（MLA）和DeepSeekMoE架构，继承了DeepSeekV2模型的优势，并在性能、效率和功能上进行了显著提升。 9dc913a037774fc0b248376905c85da5 DeepSeekR1DistillLlama70B DeepSeekR1DistillLlama70B是基于Llama架构并经过强化学习和蒸馏优化开发的高性能语言模型。该模型融合了DeepSeekR1的先进知识蒸馏技术与Llama70B模型的架构优势。通过知识蒸馏，在保持较小参数规模的同时，具备强大的语言理解和生成能力。 515fdba33cc84aa799bbd44b6e00660d DeepSeekR1DistillQwen32B DeepSeekR1DistillQwen32B是通过知识蒸馏技术从DeepSeekR1模型中提炼出来的小型语言模型。它继承了DeepSeekR1的推理能力，专注于数学和逻辑推理任务，但体积更小，适合资源受限的环境。 b383c1eecf2c4b30b4bcca7f019cf90d Baichuan2Turbo BaichuanTurbo系列模型是百川智能推出的大语言模型，采用搜索增强技术实现大模型与领域知识、全网知识的全面链接。 43ac83747cb34730a00b7cfe590c89ac Llama213BChat Llama2是预先训练和微调的生成文本模型的集合，其规模从70亿到700亿个参数不等。这是13B微调模型的存储库，针对对话用例进行了优化。 96dc8f33609d4ce6af3ff55ea377831a Qwen7BChat 通义千问7B（Qwen7B）是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。同时，在Qwen7B的基础上，使用对齐机制打造了基于大语言模型的AI助手Qwen7BChat。 fc23987da1344a8f8bdf1274e832f193 Llama27BChat Llama27BChat是Meta AI开发的大型语言模型Llama2家族中最小的聊天模型。该模型有70亿个参数，并在来自公开来源的2万亿token数据上进行了预训练。它已经在超过一百万个人工注释的指令数据集上进行了微调。 e30f90ca899a4b1a9c25c0949edd64fc Llama270BChat Llama 2 是预训练和微调的生成文本模型的集合，规模从 70 亿到 700 亿个参数不等。这是 70B 微调模型的存储库，针对对话用例进行了优化。 bafbc7785d50466c89819da43964332b Qwen1.57BChat 通义千问1.5（Qwen1.5）是阿里云研发的通义千问系列开源模型，是一种基于 Transformer 的纯解码器语言模型，已在大量数据上进行了预训练。该系列包括Base和Chat等多版本、多规模，满足不同的计算需求，这是Qwen1.57BChat版本。 bfc0bdbf8b394c139a734235b1e6f887 Qwen272BInstruct Qwen2 是 Qwen 大型语言模型的新系列。Qwen2发布了5个尺寸的预训练和指令微调模型，包括Qwen20.5B、Qwen21.5B、Qwen27B、Qwen257BA14B以及Qwen272B。这是指令调整的 72B Qwen2 模型，使用了大量数据对模型进行了预训练，并使用监督微调和直接偏好优化对模型进行了后训练。 2f05789705a64606a552fc2b30326bba ChatGLM36B ChatGLM36B 是 ChatGLM 系列最新一代的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，ChatGLM36B 引入了更强大的基础模型、更完整的功能支持、更全面的开源序列几大特性。 7450fa195778420393542c7fa13c6640 TeleChat12B 星辰语义大模型TeleChat是由中电信人工智能科技有限公司研发训练的大语言模型，TeleChat12B模型基座采用3万亿 Tokens中英文高质量语料进行训练。TeleChat12Bbot在模型结构、训练数据、训练方法等方面进行了改进，在通用问答和知识类、代码类、数学类榜单上相比TeleChat7Bbot均有大幅提升。 fdc31b36028043c48b15131885b148ce Qwen1.514BChat 通义千问1.5（Qwen1.5）是阿里云研发的通义千问系列开源模型，是一种基于 Transformer 的纯解码器语言模型，已在大量数据上进行了预训练。该系列包括Base和Chat等多版本、多规模，满足不同的计算需求，这是Qwen1.514BChat版本。 acfe01f00b0c4ff49c29c6c77b771b60 Llama38BInstruct Meta 开发并发布了 Meta Llama 3 系列大型语言模型（LLM），包含 8B 和 70B 两种参数大小，Llama38BInstruct 是经过指令微调的版本，针对对话用例进行了优化，在常见的行业基准测试中优于许多可用的开源聊天模型。 bda59c34e4424598bbd5930eba713fbf Llama370BInstruct Meta 开发并发布了 Meta Llama 3 系列大型语言模型（LLM），包含 8B 和 70B 两种参数大小，Llama370BInstruct 是经过指令微调的版本，针对对话用例进行了优化，在常见的行业基准测试中优于许多可用的开源聊天模型。 6192ed0cb6334302a2c32735dbbb6ce3 Qwen1.572BChat 通义千问1.5（Qwen1.5）是阿里云研发的通义千问系列开源模型，是一种基于 Transformer 的纯解码器语言模型，已在大量数据上进行了预训练。该系列包括Base和Chat等多版本、多规模，满足不同的计算需求，这是Qwen1.572BChat版本。 9d140d415f11414aa05c8888e267a896 Qwen1.532BChat Qwen1.532B 是 Qwen1.5 语言模型系列的最新成员，除了模型大小外，其在模型架构上除了GQA几乎无其他差异。GQA能让该模型在模型服务时具有更高的推理效率潜力。这是Qwen1.532BChat版本。 12d5a37bf1ed4bf9b1cb8e446cfa60b3 InternLM2Chat7B InternLM2Chat7B 是书生·浦语大模型系列中开源的 70 亿参数库模型和针对实际场景量身定制的聊天模型。InternLM2相比于初代InternLM，在推理、数学、代码等方面的能力提升尤为显著，综合能力领先于同量级开源模型。 50beebff68b34803bd71d380e49078f5 Qwen27BInstruct Qwen27BInstruct是 Qwen2大型语言模型系列中覆盖70亿参数的指令调优语言模型，支持高达 131,072 个令牌的上下文长度，能够处理大量输入。 0e97efbf3aa042ebbaf0b2d358403b94 QwenVLChat QwenVLChat模型是在阿里云研发的大规模视觉语言模型 QwenVL 系列的基础上，使用对齐机制打造的视觉AI助手，该模型有更优秀的中文指令跟随，支持更灵活的交互方式，包括多图、多轮问答、创作等能力。 e8c39004ff804ca699d47b9254039db8 StableDiffusionV2.1 StableDiffusionV2.1是由 Stability AI 公司推出的基于深度学习的文生图模型，它能够根据文本描述生成详细的图像，同时也可以应用于其他任务，例如图生图，生成简短视频等。 40f9ae16e840417289ad2951f5b2c88f DeepseekV2LiteChat DeepseekV2LiteChat是一款强大的开源专家混合（MoE）语言聊天模型，具有16B参数，2.4B活动参数，使用5.7T令牌从头开始训练，其特点是同时具备经济的训练和高效的推理。 0855b510473e4ec3a029569853f64974 Qwen2.572BInstruct Qwen2.5系列发布了许多基本语言模型和指令调整语言模型，参数范围从0.5到720亿个参数不等。Qwen2.572BInstruct模型是Qwen2.5系列大型语言模型指令调整版本。 d9df728b30a346afb74d2099b6c209aa Gemma29BIT Gemma29BIT是Google最新发布的具有90亿参数的开源大型语言模型的指令调优版本。模型在大量文本数据上进行预训练，并且在性能上相较于前一代有了显著提升。该版本的性能在同类产品中也处于领先地位，超过了Llama38B和其他同规模的开源模型。 4dae2b9727db46b7b86e84e8ae6530a9 Llama3.23BInstruct Meta Llama3.2多语言大型语言模型（LLMs）系列是一系列预训练及指令微调的生成模型，包含1B和3B参数规模。Llama3.2指令微调的纯文本模型专门针对多语言对话应用场景进行了优化，包括代理检索和摘要任务。它们在通用行业基准测试中超越了许多可用的开源和闭源聊天模型。这是Llama3.23BInstruct版本。 f7d0baa95fd2480280214bfe505b0e2e ChatGLM36B32K ChatGLM36B32K模型在ChatGLM36B的基础上进一步强化了对于长文本的理解能力，能够更好的处理最多32K长度的上下文。具体对位置编码进行了更新，并设计了更有针对性的长文本训练方法，在对话阶段使用 32K 的上下文长度训练。 98b6d84f6b15421886d64350f2832782 CodeGemma7BIT CodeGemma是构建在Gemma之上的轻量级开放代码模型的集合。CodeGemma7BIT模型是CodeGemma系列模型之一，是一种文本到文本和文本到代码的解码器模型的指令调整变体，具有70亿参数，可用于代码聊天和指令跟随。 fa8b78d2db034b6798c894e30fba1173 Qwen2.5Math7BInstruct Qwen2.5Math系列是数学专项大语言模型Qwen2Math的升级版。系列包括1.5B、7B、72B三种参数的基础模型和指令微调模型以及数学奖励模型Qwen2.5MathRM72B，Qwen2.5Math7BInstruct的性能与Qwen2Math72BInstruct相当。 ea056b1eedfc479198b49e2ef156e2aa DeepSeekCoderV2LiteInstruct DeepSeekCoderV2LiteInstruct是一款强大的开源专家混合（MoE）语言聊天模型，具有16B参数，2.4B活动参数。该模型基于DeepSeekV2进一步预训练，增加了6T Tokens，可在特定的代码任务中实现与GPT4Turbo相当的性能。 f23651e4a8904ea589a6372e0e860b10

来自：
帮助文档
训推服务
API参考
推理服务API
API列表
使用Cubecni网络插件(1)
注解含义 k8s.ctyun.com/networkpriority: besteffort 适用于大宽带业务 k8s.ctyun.com/networkpriority: burstable 默认值，适用于普通业务 k8s.ctyun.com/networkpriority: guaranteed 适用于延迟敏感业务

来自：
创建半托管迁移代理(1)
参数是否必填参数类型说明示例下级对象 regionID 是 String 资源池ID 81f7728xxxxx0155d307d5b agentName 是 String 代理名称，必须为大小写字母、数字、横线或下划线，长度在432个字符之间，名称不能重复 agentkunkun

来自：
在科研助手使用Dify搭建DeepSeek知识库
本案例用于指导用户在科研助手上使用 Dify 快速搭建 DeepSeek 知识库。概述 DeepSeekR1 DeepSeekR1 是幻方量化旗下 AI 公司深度求索（DeepSeek）研发的一款高性能推理模型。该模型使用强化学习技术进行后训练，专注于提升在数学、代码和自然语言推理等复杂任务上的表现。 DeepSeekR1 在需要逻辑推理、思维链推理和实时决策的任务中表现出色，如解决高级数学问题、生成复杂代码、解析复杂科学问题等。在类似 Codeforces 的挑战场景中获得了2029 Elo 评分；在复杂推理基准测试中，表现与 OpenAI 的 o1 模型相当。尽管总共有6710亿的庞大参数，但每次前向传递时仅激活370亿个参数，比大多数大模型更加高效的利用资源。 Dify Dify 是一站式大模型应用开发平台，降低开发门槛，集成数据管理、Prompt 工程等功能，支持多模型，可云端和本地部署，适用于智能客服、内容生成、智能助手等场景，显著提升开发效率。当前在科研助手的社区镜像中，我们已经为您提前部署好了基于 Dify 搭建的DeepSeekR1:7B模型，方便您即刻体验，开箱即用。前置说明 1. 该文档为在科研助手上使用 Dify 快速搭建 DeepSeek 知识库的说明； 2. 本产品中的模型由第三方主体提供，尽管云公司已尽最大努力进行识别和维护，但仍无法保证模型的可用性。请客户按照该产品的服务协议使用该产品，做好甄别并对自行选择的服务负责。环境准备

来自：
帮助文档
科研助手
最佳实践
在科研助手使用Dify搭建DeepSeek知识库
exists子句在大数据量场景调大work_mem性能更好
exists子句在数据量比较大的情况下，优化器选择走Hash Semi Join，而在调大workmem后，优化器执行走Hash Join，性能会更好。本文为您介绍该场景下的详细测试情况。以下是关于该场景的测试情况： 1. workmem默认4MB时，SQL执行计划和耗时情况如下：可以看到，优化器选择走了Hash Semi Join，耗时3.7秒。 teledb explain select count(1) from t1 where exists(select 1 from t2 where t2.t1f1t1.f1); QUERY PLAN Finalize Aggregate (cost242218.32..242218.33 rows1 width8) > Remote Subquery Scan on all (dn001,dn002) (cost242218.30..242218.32 rows1 width0) > Partial Aggregate (cost242118.30..242118.31 rows1 width8) > Hash Semi Join (cost110248.00..242118.30 rows505421 width0) Hash Cond: (t1.f1 t2.t1f1) > Seq Scan on t1 (cost0.00..17420.00 rows1000000 width4) > Hash (cost79340.00..79340.00 rows3000000 width4) > Remote Subquery Scan on all (dn001,dn002) (cost100.00..79340.00 rows3000000 width4) Distribute results by S: t1f1 > Seq Scan on t2 (cost0.00..52240.00 rows3000000 width4) (10 rows) Time: 1.091 ms teledb select count(1) from t1 where exists(select 1 from t2 where t2.t1f1t1.f1); count 500000 (1 row) Time: 3779.401 ms (00:03.779) 2. workmem调整为128MB后，SQL执行计划和耗时情况如下：可以看到，优化器选择走了Hash Join，耗时1.9秒。 teledb

来自：
帮助文档
分布式融合数据库HTAP
私有云产品
SQL开发最佳实践
性能优化最佳实践
SQL优化案例
exists子句在大数据量场景调大work_mem性能更好
弹性伸缩搭配GPU云主机水平扩展最佳实践
对比传统部署模式，GPU云主机配合弹性伸缩使用，可以帮助您在推理任务高峰期自动扩容GPU节点减少卡顿，在任务请求低峰期减少GPU服务器规模节约成本，保障业务连续性的同时降低资源、运维成本。操作步骤 1. 使用大模型镜像创建包年包月的云主机实例创建一定数量的包年包月GPU实例，用于后续将实例添加到伸缩组，满足大模型业务模块的非高峰或低谷时间段要求。 1. 登录控制中心。 2. 根据业务部署需求选择弹性伸缩组及其管理的云主机实例所在地域。 3. 单击“计算>弹性云主机”，进入弹性云主机管理控制台。 4. 在右上角点击“创建云主机”按钮，进入到弹性云主机创建页面。 5. 在弹性云主机创建页面，完成云主机参数配置。创建成功之后如图：说明搭建DeepSeek等大模型云主机选型、部署等说明可参考GPU云主机/弹性云主机：零基础搭建DeepSeek云端环境指南弹性云主机DeepSeek专题实践指南：DeepSeek驱动高效能云生态天翼云。 2. 创建使用大模型镜像的伸缩配置为业务创建可用于自动扩容的云主机模板，即弹性伸缩配置。 1. 登录控制中心，选择弹性伸缩组所在地域（与前一步骤中创建的GPU云主机需保持一致）。 2. 单击“计算>弹性伸缩服务”，进入弹性伸缩管理控制台并切换到伸缩配置页面。 3. 点击右上角“创建伸缩配置”，进入“创建伸缩”配置页面。使用步骤1中创建的实例作为模板创建伸缩配置。 4. 点击“确认”，即可创建伸缩配置成功，创建成功如图所示： 3. 创建伸缩组并添加云主机实例为低成本、高稳定性业务集群创建弹性伸缩组，并将创建好的云主机实例添加至此伸缩组内，来满足日常业务的需求。 1. 登录控制中心，选择弹性伸缩组所在地域（与前一步骤中创建的GPU云主机需保持一致）。 2. 单击“计算>弹性伸缩服务”，进入弹性伸缩管理控制台。 3. 在“弹性伸缩组”页签中，点击右上角“创建弹性伸缩组”，进入“创建弹性伸缩组>伸缩参数”配置页面。 4. 在“伸缩参数”页面完成基础配置，具体参数配置可参见创建伸缩组。 5. 在“配置来源”页面，选择已有配置，为伸缩组绑定一个或多个配置。 6. 点击“立即创建”伸缩组创建成功，如下图： 7. 伸缩组创建成功之后，进入到伸缩组详情页面，将步骤1中创建包年包月弹性云主机添加至伸缩组内并开启伸缩保护防止实例被移除，用于日常业务需求的满足。具体操作步骤请参见将实例移入伸缩组。添加成功之后如图： 4. 根据业务场景为伸缩组设置自动伸缩策略为已创建好的伸缩组设置伸缩策略，来满足突发的业务流量变化，确保业务的稳定运行。 1. 进入弹性伸缩管理控制台，点击步骤3创建好的伸缩组名称，进入到伸缩组详情页面。 2. 单击“伸缩策略”进入伸缩策略页签，单击“创建策略”按钮，进入到“创建伸缩策略”页面。 3. 在“创建伸缩策略”页面中完成策略的配置。您可以根据使用场景选择告警、定时等自动伸缩策略，帮助伸缩组在业务高峰期自动扩容大模型实例、在业务低谷期自动释放实例，保证业务稳定的同时最大程度的优化资源使用成本。具体操作步骤可参见创建伸缩策略。

来自：
帮助文档
弹性云主机 ECS
最佳实践
AIGC实践
弹性伸缩搭配GPU云主机水平扩展最佳实践
常用数据库参数调优
参数类型用途默认值/最大值生效方式 sharedbuffers integer 设置数据库服务器将使用的共享内存缓冲区大小，这个值一般建议1/4物理内存大小。由于进程之间需要同步共享内存信息、且PG还会使用操作系统缓存，因此不宜太大。需要根据内存命中率的情况适当调整该参数资源模板的1/4 restart tempbuffers integer 连接本地内存，仅用于访问临时表，并不是设置多大就分配多大，而是分配一个buffer指针，按需扩展到tempbuffers。 8MB userset workmem integer 连接本地内存，用于连接的一些排序、hash table等操作，如果workmem不够，则会申请临时磁盘空间。 4MB userset maintenanceworkmem integer 维护操作能申请的最大内存，例如：VACUUM, CREATE INDEX，提高会加速这些操作，包括pgrestore操作。注意autovacuumworkmem如果没有设置，则会使用这个设置，最多能申请autovacuummaxworkersautovacuumworkmem大小内存。因此建议在做维护操作的连接单独设置，并给autovacuum进程单独设置autovacuumworkmem。 64MB userset vacuumcostlimit integer 累积的cost消耗到这个值后，vacuum休眠vacuumcostdelay（默认为0，不休眠）时间。 PG为200，TDSQLPG默认为10000 restart autovacuumvacuumcostdelay floating point 当前所有autovacuum进程积累的cost消耗到autovacuumvacuumcostlimit后休眠的时间。 PG为2ms，TDSQLPG默认为20ms restart walcompression boolean full page image 在写入到WAL中进行压缩，目前是gzip压缩方式，压缩比能到30%。对wal日志比较大系统有提升，但会消耗CPU，一般在5%左右，不同CPU影响程度不一样。 off restart checkpointtimeout integer 两次自动checkpoint间隔时间，设置越大故障时间越长，但IO可能会更平滑，但不能一味设置很大，要看系统的IO、业务压力情况而定。 PG为5min，TDSQLPG默认为10min restart checkpointcompletiontarget floating point checkpoint完成目标，尽量让checkpoint在checkpointcompletiontarget checkpointtimeout时间内完成。如果checkpoint时间太短，会让checkpoint进入急速模式，IO压力骤增。 PG为0.5min，TDSQLPG默认为0.93 restart randompagecost integer 随机扫描一个块的代价基准值，建议值：SATA/SAS盘： 4SSD：2Nvme SSD：1 PG为4，TDSQLPG默认为2 restart effectivecachesize integer 生成执行计划时，评估数据库能用的缓冲内存大小(sharedbuffers+操作系统的文件系统缓存)，不会实际占用。值越大更偏向于走索引扫描，一般可设置总内存 sharedbuffers 业务内存。 4GB restart logmindurationstatement integer 执行时间超过logmindurationstatement的SQL将记录到数据库运行日志中。 PG为1，TDSQLPG默认为10000 reload logstatement enum 设置数据库对那些类型SQL进行日志记录。推荐设置为DDL，加上logmindurationstatement针对慢SQL的设置即可。 PG为none，TDSQLPG默认为ddl reload autovacuumvacuumscalefactor integer 表中数据变化（inserted, updated or deleted tuples）超过表数据比例，之后才会触发autovacuum中的vacuum。 autovacuumanalyzescalefactor同理（PG为0.1，TDSQLPG默认为0.0001）。 PG为0.2，TDSQLPG默认为0.0002 库/表级参数，表级优先 reload fillfactor integer 表填充因子，数据块在插入多少比例数据之后不再插入，留下空间给update操作copy新行使用。在同一块中申请空间，将用到HOT update，对update性能提升很大。默认为100 表级参数。更改参数需要重建表生效。

来自：
帮助文档
分布式融合数据库HTAP
私有云产品
SQL开发最佳实践
性能优化最佳实践
配置参数调优
常用数据库参数调优
约束与限制
限制项说明带宽单个天翼云账号内网默认的读写（GET/PUT）带宽上限是16Gbit/s；单个天翼云账号公网默认的读写（GET/PUT）带宽上限是1Gbit/s；如果您的业务有更大的带宽需求，请提交工单申请。每秒请求数（Query Per Second, QPS）单个天翼云帐号默认的写请求（PUT Object）上限是6000请求每秒。单个天翼云帐号默认的读请求（GET Object）上限是10000请求每秒。单个天翼云帐号默认的列举类请求（LIST）上限是1000请求每秒。说明如果用户在对象命名规则上使用了顺序前缀（如时间戳或字母顺序），可能导致大量对象的请求访问集中于某个特定分区，造成访问热点，会使热点分区上的请求速率受限，访问时延上升。推荐使用随机前缀对象名，这样请求就会均匀分布在多个分区，达到水平扩展的效果。使用随机前缀对象名的方法。如果您的业务有更大的QPS需求，请提交工单申请。

来自：
帮助文档
对象存储 OBS
产品简介
约束与限制
约束与限制(1)
限制项说明带宽单个天翼云账号内网默认的读写（GET/PUT）带宽上限是16Gbit/s；单个天翼云账号公网默认的读写（GET/PUT）带宽上限是1Gbit/s；如果您的业务有更大的带宽需求，请提交工单申请。每秒请求数（Query Per Second, QPS）单个天翼云帐号默认的写请求（PUT Object）上限是6000请求每秒。单个天翼云帐号默认的读请求（GET Object）上限是10000请求每秒。单个天翼云帐号默认的列举类请求（LIST）上限是1000请求每秒。说明如果用户在对象命名规则上使用了顺序前缀（如时间戳或字母顺序），可能导致大量对象的请求访问集中于某个特定分区，造成访问热点，会使热点分区上的请求速率受限，访问时延上升。推荐使用随机前缀对象名，这样请求就会均匀分布在多个分区，达到水平扩展的效果。使用随机前缀对象名的方法。如果您的业务有更大的QPS需求，请提交工单申请。

来自：
使用限制
本文为您介绍分布式消息服务MQTT各功能项使用限制。功能信息项限制值说明实例名称长度4~40个字符，大小写字母开头，只能包含大小写字母、数字及分隔符() 实例名称不可重复。 Topic 长度 64 个字符 Topic 长度不得超过该限制，否则会导致无法发送或者订阅。 Topic 和 Client ID 可用字符仅限数字 09，字母 az 或 AZ，和符号“”、“” Client ID 和MQTT 的 Topic 不允许使用“/”、“:”、“,”、“%”等其他非常规字符，否则可能导致无法连接和收发消息。 Client ID 长度 64 个字符使用微消息队列 MQTT 收发消息时，Client ID 长度不得超过该限制，否则会导致连接被断开。消息大小 64 KB 字节消息负载不得超过该限制，否则消息会被丢弃。单个设备订阅Topic 数量 30 个每个客户端最多允许同时订阅 30 个 Topic，超过该限制会导致无法新增新的订阅关系。每个持久化会话离线消息存储数量 1,000,条服务端会限制每个持久化会话的离线消息数量。超过该限制后，服务端会从最早的消息开始清理。因此，请合理使用持久化订阅模式，以免产生很多无用的离线消息。

来自：
帮助文档
分布式消息服务MQTT
产品介绍
使用限制
交易加速与防护
本文介绍对金融类客户的产品价值。业务特点交易（电商交易、金融支付、账单同步等场景）重视用户体验与数据安全，整体IT建设标准高，如果业务运营中出现延迟掉包、系统运行缓慢、数据容易丢失、账户数据被篡改、恶意刷优惠券等问题，会影响用户的恐慌，导致客户业务流失。客户痛点信用卡商城、手机网银、支付类业务数据实时性要求高。热门纪念币、优惠券抢购体量大，易高并发。行情推送类使用特殊websocket协议传输。客户不愿上传证书加速。电商大促抢购高峰拥堵，支付、秒杀等大量并发请求。用户敏感信息容易泄露。海外攻击团队勒索。业务欺诈、营销欺诈。产品价值智能加速：通过多级缓存，就近响应用户请求；实时探测，选择最优路径动态回源；IPv6一键开启。一体化安全+防护：对攻击进行层层识别和防御，避免数据泄漏造成负面影响。行业情报共享：对全网在服的金融客户遭受的攻击行为进行分析，不断优化安全防护模板。爬虫防护：区分恶意爬虫，SEO/SEM推广，在拦截爬虫的同时，保障业务的正常进行。基于零信任架构，实现内部业务和端口隐身，保护数据安全。

来自：
帮助文档
边缘安全加速平台
产品介绍
应用场景
交易加速与防护
用户权限管理
$%^&)。按照实际需求填写描述。 4）设置用户主题或订阅组权限点击“主题权限”或“订阅组”，可以设置该用户的主题或订阅组发布或订阅权限： 5）选择主题名称及对应权限，PUB代表生产权限 SUB代表消费权限，DENY代表无任何权限，用符号相连即表示两种权限都有如PUBSUB。 6）选择订阅组名称及对应权限，权限说明同上。角色控制以下适用于华东1、华北2、西南1、华南2、上海36、青岛20、长沙42、南昌5、武汉41、杭州7、西南2贵州、太原4、郑州5、西安7 节点。 1）点击【新建用户】按钮 2）弹出框填写用户字段填写应用用户名，请输入大于6位字符，只能输入大小写字母，下划线，数字。填写密钥，请输入大于8位字符，需要包含数字大小写字母以及特殊符号(!@

来自：
函数运行时间超过函数最大Timeout时间怎么办？
函数计算服务限制单个函数的最长执行时间为24小时（86400秒）。如果您的应用场景需要函数运行超过上述限制，您可以考虑将复杂的大函数分解为若干个较小的、可独立执行的函数。

来自：
帮助文档
函数计算
常见问题
函数管理
函数运行时间超过函数最大Timeout时间怎么办？
备份恢复
场景描述 canal解析Binlog出现错误，导致拉取Binlog中断，错误信息如下： com.alibaba.otter.canal.parse.exception.CanalParseException: java.lang.NumberFormatException: Caused by: java.lang.NumberFormatException: at com.alibaba.fastsql.sql.parser.Lexer.integerValue(Lexer.java:2454) 原因分析检查TaurusDB的参数“binlogrowsquerylogevents”的值是否设置为1 或 ON 。目前canal只能支持ROW格式的Binlog增量订阅。当TaurusDB的参数“binlogrowsquerylogevents”的值设置为1 或ON时，会在Binlog中产生Rowsquery类型的event，此类event非ROW格式，一些场景下，会导致canal出现blank topic问题，引发Binlog解析失败。解决方案将TaurusDB的参数“binlogrowsquerylogevents”的值修改为 OFF ，重启中断的canal任务。使用mysqldump导出大表的注意事项在使用mysqldump导出数据时，倘若添加–q(quick) 参数时，select出来的结果将不会存放在缓存中，而是直接导出到标准输出中。如果不添加该参数，则会把select的结果放在本地缓存中，然后再输出给客户端。如果只是备份小量数据，足以放在空闲内存buffer中的话，禁用q参数，则导出速度会快一些。对于大数据集，如果没办法完全储存在内存缓存中时，就会产生swap。对于大数据集的导出，不添加q参数，不但会消耗主机的内存，也可能会造成数据库主机因无可用内存继而宕机的严重后果。因此，如果使用mysqldump来备份数据时，建议添加q参数。导出示例： mysqldump uroot pP 8635 h 192.168.0.199 setgtidpurgedOFF singletransaction flushlogs q test t1 >t1.sql mysqldump的6大使用场景的导出命令

来自：
帮助文档
云数据库TaurusDB
故障排除
备份恢复
终端杀毒（文档停止维护）
天翼云终端杀毒(统一服务器安全管理系统)面向政企用户的以大数据技术为支撑、以可靠服务为保障,能够精确检测已知病毒木马、未知恶意代码,有效防御APT攻击,为政企事业单位提供终端病毒、漏洞管控能力。

来自：
帮助文档
终端杀毒（文档停止维护）
增加 Consumer 实例
可以在进程内直接增加（需要保证每个实例对应一个线程，否则没有太大意义），也可以部署多个消费实例进程；需要注意的是，实例个数超过分区数量后就不再能提高速度，将会有消费实例不工作。

来自：
帮助文档
分布式消息服务Kafka
最佳实践
消费者实践
增加 Consumer 实例
操作指导
功能描述全面日志采集全面支持Syslog、SNMP、OPSec、XML、FTP及本地文件等协议，可以覆盖主流硬件设备、主机及应用，保障日志信息的全面收集。实现信息资产（网络设备、安全设备、主机、应用及数据库）的日志获取，并通过预置的解析规则实现日志的解析、过滤及聚合。同时可将收集的日志通过转发功能转发到其它网管平台。大规模安全存储内置TB级别存储设备，可以选配各种RAID级别进行数据冗余和安全保障。系统拥有多项自主知识产权的存储加密机制和查询机制，十分适合等保、密保等行业的应用要求。智能关联分析实现全维度、跨设备、细粒度关联分析，内置众多的关联规则，支持网络安全攻防检测、合规性检测，可轻松实现各资产间的关联分析。脆弱性管理能够收集和管理来自各种Web漏洞扫描工具、主机漏洞扫描工具、网络漏洞扫描工具产生的扫描结果，并实时和用户资产收到的攻击危险进行风险三维关联分析。数据挖掘和数据预测支持对历史日志数据进行数据挖掘分析，发现日志和事件间的潜在关联关系，并对挖掘结果进行可视化展示。系统自带多种数据统计预测算法，可以根据历史数据的规律对未来的数据发生情况进行有效预测。可视化展示实现对信息资产的实时监控、信息资产与客户管理、解析规则与关联规则的定义与分发、日志信息的统计与报表、海量日志的存储与快速检索以及平台的管理。通过各种事件的归化处理，实现高性能的海量事件存储和检索优化功能，提供高速的事件检索能力。事后的合规性统计分析处理，可对数据进行二次挖掘分析。分布式部署和管理平台支持分布式部署，可以在中心平台管理规则、配置策略自动分发、远程自动升级等，极大地降低了分布式部署的难度，提高了可管理性。灵活的可扩展性提供多种定制接口，实现强大的二次开发能力以及与第三方平台对接和扩展的能力。

来自：
帮助文档
云等保专区
用户指南
日志审计
日志审计v1.0
操作指导
内存优化型
使用场景应用：关系数据库和NoSQL数据库、内存数据分析等。场景特点：内存要求高，同时要求内存优化。适用场景：大数据分析，如广告精准营销、电商、车联网等高性能数据库场景。

来自：
帮助文档
弹性云主机 ECS
产品介绍
实例规格(X86)
内存优化型
LIMIT分页优化
在处理大量数据的分页查询时，使用LIMIT offset, rowcount可能会导致性能问题，尤其是在需要跳过大量记录时。本文为您介绍LIMIT分页问题的分析、优化思路及示例。问题分析对于分页查询，使用 LIMIT offset, rowcount 的传统方法（如 SELECT FROM user LIMIT 100000, 1;）会导致性能下降。这是因为MySQL需要扫描并丢弃 offset 指定的行数，然后才能返回所需 rowcount 行的数据。例如，查询 LIMIT 100000, 1 ，则需要扫描100001行数据，因此，该方式的效率极低。优化思路 1. 避免跳页功能：尽可能避免直接跳转到任意页（如最后一页）的功能。 2. 使用范围查询：通过记录上一页的最大ID，使用范围查询来替代 LIMIT offset。该方式可以有效减少待扫描的行数，以提高效率。优化示例通过避免使用 LIMIT offset 进行大范围分页，并采用范围查询或子查询等方法，可以显著提高MySQL分页查询的性能。您可以根据具体应用场景选择合适的优化策略，可以有效减少数据库的负载和提高响应速度。使用上一页的最大ID进行范围查询假设上一页的最大ID是23456，可以优化查询如下： plaintext SELECT FROM user WHERE id > 23456 LIMIT 1; 子查询优化如果必须使用 LIMIT offset，可以通过子查询来减少扫描的行数： plaintext SELECT FROM user WHERE id > (SELECT id FROM user LIMIT 10000, 1) LIMIT 1; 使用INNER JOIN 优化 plaintext SELECT FROM user INNER JOIN (SELECT id FROM user LIMIT 10000, 1) AS subquery USING (id); 小范围分页如果只需要返回少量数据，可以结合LIMIT和OFFSET使用，但需要尽量避免在大偏移量时使用： plaintext SELECT id FROM user LIMIT 10000, 10; 避免使用 IN 子句避免使用IN子句进行分页，因为它可能导致性能问题，尤其是在数据量大的场景下： plaintext 避免使用以下格式 SELECT FROM user WHERE id IN (123, 345, ...);

来自：
帮助文档
分布式关系型数据库
开发指南
SQL调优指南
LIMIT分页优化
管理节点标签
本文主要介绍管理节点标签。节点标签可以给节点打上不同的标签，给节点定义不同的属性，通过这些标签可以快速的了解各个节点的特点。节点标签使用场景节点标签的主要使用场景有两类。节点管理：通过节点标签管理节点，给节点分类。工作负载与节点的亲和与反亲和：有的工作负载需要的CPU大，有的工作负载需要的内存大，有的工作负载需要IO大，可能会影响其他工作负载正常工作等等，此时建议给节点添加不同标签。在部署工作负载的时候，就可以选择相应标签的节点亲和部署，保证系统正常工作；反之，可以使用节点的反亲和部署。一个系统可以分为多个模块，每个模块由多个微服务组成，为保证后期运维的高效，可以将节点打上对应模块的标签，让各模块部署到各自的节点模块上，互不干扰，方便开发到各自节点上去维护。节点固有标签节点创建出来会存在一些固有的标签，并且是无法删除的，这些标签的含义请参见下表。表节点固有标签键说明新：topology.kubernetes.io/region 旧：failuredomain.beta.kubernetes.io/region 表示节点当前所在区域。新：topology.kubernetes.io/zone 旧：failuredomain.beta.kubernetes.io/zone 表示节点所在区域的可用区。新：node.kubernetes.io/baremetal 旧：failuredomain.beta.kubernetes.io/isbaremetal 表示是否为物理机节点。例如：false，表示非物理机节点 node.kubernetes.io/containerengine 表示容器引擎。例如：docker、containerd node.kubernetes.io/instancetype 节点实例规格。 kubernetes.io/arch 节点处理器架构。 kubernetes.io/hostname 节点名称。 kubernetes.io/os 节点操作系统类型。 node.kubernetes.io/subnetid 节点所在子网的ID。 os.architecture 表示节点处理器架构。例如：amd64，表示AMD64位架构的处理器 os.name 节点的操作系统名称。 os.version 操作系统节点内核版本。 node.kubernetes.io/containerengine 节点所用容器引擎。 accelerator GPU节点标签。 cce.cloud.com/ccenodepool 节点池节点专属标签。

来自：
帮助文档
云容器引擎
用户指南
节点管理
管理节点标签
计费概述
本文介绍应用加速计费概述。计费项应用加速（中国内地）的计费项分为三个部分：频道费+端口费+带宽费。频道费：按照加速域名数量收费。端口费：按照使用的tcp端口和udp端口总数收费。带宽费：由于应用加速支持加速的应用非常多（支持加速基于tcp/udp的所有协议的应用），有些应用上行带宽大，有些应用下行带宽大，因此应用加速带宽费按照上行+下行总带宽收费。计费方式天翼云应用加速支持按需付费。按需付费（后付费）指的是按照各计费项的实际用量结算费用，先使用，后付费，适用于业务用量经常有变化的场景。计费模式计费方式计费项计费描述参考链接按需计费按带宽月带宽第四峰值计费在一个自然月内，计算每日的峰值带宽（每5分钟统计一个带宽数据，每日得到288个值，取其中的最大值），所有日峰值带宽降序排列，取第四大的日峰值带宽作为计费带宽。按需计费按需计费按带宽月带宽95峰值计费在一个自然月内，每5分钟统计一个带宽数据，每日得到288个值，对所有计量点（N）带宽降序排列，并且按照带宽由大到小扣除M（MN0.05，如果有出现小数点的情况，则去掉小数点后的数值以后取整）个点，则第M+1个点的带宽值即为当月的95计费带宽。按需计费按需计费按带宽月平均日带宽峰值计费在一个自然月内，对所有有效日的最大峰值带宽求和取平均，获得当月的日峰值平均带宽计费。按需计费按需计费按带宽月带宽峰值计费在一个自然月内，对每日的峰值进行排序，最大的那个峰值作为计费值。按需计费

来自：
帮助文档
应用加速（文档停止维护）
计费说明
计费概述
迁移类
操作系统影响因素说明 CPU和内存占用率迁移过程中会占用源端主机的一部分内存和CPU，占用情况根据主机的实际情况有所不同。迁移前确保源端主机CPU和内存占用率不高于75%，实际预留内存不少于520MB。网络带宽主机迁移对网络有较为严格的要求，需要保证源端和目的端网络通畅，源端与目的端的网络延迟不能过高，迁移带宽取源端和目的端之间较小值。 Windows 磁盘碎片 Windows是块级迁移，迁移会读取磁盘中的有效块，由于Windows的特性，在日常使用中会产生大量的磁盘碎片，通常Windows使用时间越长，磁盘碎片会越多，从而影响迁移时长。 Linux 文件过大小文件过多 Linux是文件级迁移，源端小文件过多或者有比较大的文件，都会影响迁移速度。源端单个文件超过2GB，可能导致迁移时间长。源端小文件数据量过多，比如有超过一万个小于20KB的小文件，可能导致迁移时间长

来自：
帮助文档
云迁移工具RDA
常见问题
迁移类
物理专线介绍
本文将为您介绍物理专线的概念与特点。物理专线概念物理专线：物理专线是对客户侧站点和云资源池交换机之间的网络链路的抽象。与传统互联网链路相比，物理专线提供用户本地数据中心上云的专属通道，业务传输质量更高，并采用虚拟化技术实现用户业务数据逻辑隔离，更加安全可靠，云专线兼容底层IPRAN、MSTP、MPLS VPN、OTN等多种线路类型，支持1G/10G/100G等多种端口带宽规格；同时提供端口聚合和链路能力，实现专线带宽弹性扩容，帮助企业轻松应对大流量业务传输场景。用户可申请独享物理专线和共享物理专线。独享物理专线，用户独占一个物理端口资源；共享物理专线，多用户共享一条物理线路，通过三层子接口方式实现多租户数据隔离。物理专线特点一般来说，物理专线的特点包括：稳定性与可靠性：物理专线是专门为特定客户建立的，因此通常比公共互联网连接更稳定，不容易受到网络拥塞等因素的影响。低延迟：由于物理专线是专用的线路，其传输路径较短，可以实现更低的延迟，适用于对实时性要求较高的应用场景。高带宽：物理专线通常提供高带宽的连接，适用于大规模数据传输、高清视频等需要大流量的场景。数据安全性：由于物理专线是专用连接，相对于公共互联网连接，具有更高的数据安全性，可以减少信息被窃取或篡改的风险。

来自：
通过私有镜像创建物理机
参数命名规则计费模式支持“包年/包月”和“按量付费”方式。实例名称 • 长度为227字符（{R:数字}模式串不计入字符长度） • 支持{R:数字}形式，且只支持使用1次，此处数字需为小于等于9799的正整数，不支持冒号“:”以及大括号“{}”两类字符单独存在或其它组合方式主机名称 •Windows 系统长度为 211个字符，其他操作系统(如Linux)长度为 259个字符（{R:数字}模式串不计入字符长度） • 允许使用大小写字母、数字、连字符 “” • 支持{R:数字}形式，且只支持使用1次，此处数字需为小于等于9799的正整数，不支持冒号“:”以及大括号“{}”两类字符单独存在或其它组合方式 • 不能连续使用 “” • 必须以字母开头，“”不能用于开头或结尾 • 不能仅使用数字

来自：
帮助文档
物理机 DPS
用户指南
实例
创建物理机
通过私有镜像创建物理机
DeepSeek-R1
版本列表版本说明 DeepSeekR1 DeepSeekR1是一款具有671B参数大小的创新性大语言模型，在多个NLP基准测试中表现出色，具备较强的泛化能力和适应性。

来自：
帮助文档
训推服务
模型简介
DeepSeek-R1
R1
版本列表版本说明 DeepSeekR1 DeepSeekR1是一款具有671B参数大小的创新性大语言模型，在多个NLP基准测试中表现出色，具备较强的泛化能力和适应性。

来自：
12B
版本列表版本说明 TeleChat12B 星辰语义大模型TeleChat开源的12B参数版本，支持deepspeed微调和多轮对话能力，在外推能力和长文生成方面展现出优异表现。其开源版本包括12B模型的int8和int4量化版本。

来自：
模型适配专家服务
模型适配专家服务为客户解决模型在国产化算力上训练、推理的适配难题,将大模型适配到一定规模的升腾算力机器环境,跑通分布式训练和推理的服务,帮助客户的大模型应用高效、快速地迁移到国产化算力上。

来自：
帮助文档
模型适配专家服务
x86 V4实例（CPU采用Intel Broadwell架构）
通用型提供均衡的计算、存储以及网络配置，满足资源专享、网络隔离、性能有基本要求的业务场景：如数据库、核心ERP系统、金融系统等。规格名称业务场景 CPU 内存本地磁盘扩展配置 :::::: physical.s3.large 数据库、大数据 20cores Intel Xeon E52618 V4 (210core，2.20GHz） 128GB SAS 2600G 2x210GE physical.s3.large 数据库、大数据 20cores Intel Xeon E52618 V4 (210core，2.20GHz） 128GB SAS 2600G 2x210GE physical.s3.xlarge 数据库、大数据、核心ERP系统 28cores Intel Xeon E52658 V4 (214core，2.30GHz） 256GB SAS 2600G 2x210GE physical.s3.xlarge 数据库、大数据、核心ERP系统 28cores Intel Xeon E52658 V4 (214core，2.30GHz） 256GB SAS 2600G 2x210GE 本地存储型系统盘和数据盘均使用本地磁盘，针对数据量大，对计算性能、稳定性、实时性等要求很高的业务场景：如大数据、分布式缓存等。规格名称业务场景 CPU 内存本地磁盘扩展配置 physical.d1.large 数据库、大数据 20cores Intel(R) Xeon(R) CPU E52618L v4(210core，2.20GHz) 128GB SATA 84T 410GE

来自：
帮助文档
物理机 DPS
产品简介
实例规格说明
x86 V4实例（CPU采用Intel Broadwell架构）
API列表
平台提供了以下大模型API能力。模型模型简介模型ID DeepSeekV3.2（旗舰版） DeepSeekV3.2是深度求索（DeepSeek）开源的最新一代旗舰级通用大模型。该模型是一个在高计算效率与卓越推理和代理性能之间取得平衡的模型。实现了顶尖性能与超高推理效率的完美平衡，该模型在编程、数学、推理及多语言理解等核心任务上展现出卓越能力，是面向开发者与企业的高级智能助手。 24625803b01f4f90b72abbe9d9cdf5cc GLM5（正式版） GLM5是智谱AI推出的最新一代旗舰级开源大模型，专为应对复杂系统工程和长周期智能体任务而设计。该模型坚持扩展（Scaling）路线，参数量从前代的 355B（激活 32B）扩展至744B（激活 40B），预训练数据量提升至 28.5Ttokens。GLM5集成了 DeepSeek 稀疏注意力（DSA）机制，并引入了全新的异步强化学习基础设施“slime”，在推理、编程和智能体任务上表现卓越。 5df2c9ff4ad347cb95ea42ad6e9e1729 Qwen3.5397BA17B（正式版） Qwen3.5397BA17B 是阿里通义千问团队研发的新一代旗舰级开源多模态 MoE（Mixture of Experts）模型。该模型拥有 3970 亿总参数，但在推理时仅激活 170 亿参数（A17B），实现了极致的性能与效率平衡。Qwen3.5 采用了创新的“门控 DeltaNet + MoE”混合架构，实现了视觉与语言的早期融合训练。它不仅在推理、编码和多语言理解上跨代际超越了前代。 fde2b0a897b140bda7909861ed734671 DoubaoSeed2.0pro DoubaoSeed2.0Pro 是字节跳动推出的最新一代旗舰级通用Agent大模型，隶属于豆包大模型2.0系列，专为应对大规模生产环境下的深度推理与长链路任务执行场景而设计，全面对标GPT 5.2与Gemini 3 Pro。该模型围绕真实世界复杂任务需求进行系统性优化，强化了多模态理解、复杂指令执行与长尾领域知识储备，在数学推理、视觉感知、长上下文处理等多个基准测试中达到业界顶尖水平。其token定价较同级海外模型降低约一个数量级，在保证卓越性能的同时大幅降低部署与使用成本，进一步缩小了与前沿闭源模型的差距，目前已在豆包App、电脑端、网页版及火山引擎API服务同步上线。 d4432662ebed421890bf8fe60e400439 Qwen3Max 千问3系列Max模型，相较preview版本在智能体编程与工具调用方向进行了专项升级。本次发布的正式版模型达到领域SOTA水平，适配场景更加复杂的智能体需求。 3d1c69eb6e1d40f186124b98141e64fd DoubaoSeed1.8 DoubaoSeed1.8是字节跳动自主研发的最新一代旗舰级多模态通用智能体（General Agent）大模型，于2025年12月18日在FORCE原动力大会上正式发布，专为应对真实场景中的复杂工作流、多模态交互及智能体执行任务而设计。该模型突破传统单一语言模型局限，实现从“回答问题”到“执行任务”的质变，融合视觉、语言、推理和行动能力于一体，优化了图片编码token数量与推理效率，在多模态理解、智能体操作、代码编写等领域表现卓越，跻身全球大模型第一梯队，其日均token使用量已突破50万亿，进一步缩小了与前沿闭源模型的差距，成为面向实际应用场景的高效实干型AI助手superscript:3。 87f80d930d3e4c478e50f7a121dfbb97 DoubaoSeed1.60615 DoubaoSeed1.60615是全新多模态深度思考模型，同时支持minimal/low/medium/high 四种reasoning effort。更强模型效果，服务复杂任务和有挑战场景。 651c9b454b58458f9b604e67c03ab73f Doubao1.5pro32k Doubao1.5pro32k 是字节跳动自主研发的新一代旗舰级大模型，专为长文本处理、多场景适配及高精度任务需求而设计，是豆包1.5系列产品线的核心成员之一。该模型坚持高质量训练路线，在14.8万亿高质量tokens上完成预训练，并通过监督微调和强化学习进一步优化，相较于前代模型实现了知识、代码、推理等核心能力的全面跃升。Doubao1.5pro32k集成了稀疏MoE架构与高效上下文管理技术，坚持不使用任何其他模型生成的数据，凭借极低的幻觉率和优异的综合表现，在多项公开评测基准中达到全球领先水平，显著缩小了与前沿闭源模型（如GPT4 Turbo）的差距，可广泛适配个人、企业及专业领域的多样化需求。 3b4f6505923d48beb3d779a28c704a4e Qwen3CoderPlus Qwen3CoderPlus 是阿里通义千问团队研发的顶级代码专用大模型，在 Qwen3 通用模型基座上进行了大规模的代码专项继续预训练与指令微调。该模型熟练掌握 92 种编程语言，在代码生成、Bug 修复、代码解释及跨语言翻译等任务上表现卓越。Qwen3CoderPlus 引入了“仓库级（Repositorylevel）”代码理解技术，能够处理复杂的项目依赖关系，是程序员、数据科学家及自动化运维人员的理想开发助手。 f9089c3c29b24ac7a0148efad6c0650d Qwen3VLPlus Qwen3VLPlus 是阿里通义千问 Qwen3 家族中的增强型视觉语言模型（VisionLanguage Model），专为处理高难度的图像与视频理解任务而设计。相较于开源版本，Plus 版在视觉感知的清晰度、长视频时序分析及视觉智能体（Visual Agent）交互能力上进行了大幅强化。它采用了先进的“原生动态分辨率”技术，支持任意长宽比的图像输入，能够像人类一样精准识别密集文本、复杂图表及长达数小时的视频内容，是构建多模态应用的理想基座。 b0d79f4a19bb4fa8a71745fff38325a4 Qwen3.5397BA17B Qwen3.5397BA17B 是阿里通义千问团队研发的新一代旗舰级开源多模态 MoE（Mixture of Experts）模型。该模型拥有 3970 亿总参数，但在推理时仅激活 170 亿参数（A17B），实现了极致的性能与效率平衡。Qwen3.5 采用了创新的“门控 DeltaNet + MoE”混合架构，实现了视觉与语言的早期融合训练。它不仅在推理、编码和多语言理解上跨代际超越了前代 Qwen3，更在智能体（Agent）和视觉理解任务上表现卓越，原生支持“思考模式”，具备强大的现实世界适应能力。 06b788a9218d4a5b905e5681c2f4e721 GLM5 GLM5 是智谱 AI 推出的最新一代旗舰级开源大模型，专为应对复杂系统工程和长周期智能体（Agent）任务而设计。该模型坚持扩展（Scaling）路线，参数量从前代的 355B（激活 32B）扩展至 744B（激活 40B），预训练数据量提升至 28.5T tokens。GLM5 集成了 DeepSeek 稀疏注意力（DSA）机制，并引入了全新的异步强化学习基础设施“slime”，在推理、编程和智能体任务上表现卓越，是目前全球开源模型中的佼佼者，进一步缩小了与前沿闭源模型（如 GPT5.2）的差距。 6d3a57c3a6fb465e968b604783b89eda DeepSeekV3.2（正式版） DeepSeekV3.2是深度求索（DeepSeek）开源的最新一代旗舰级通用大模型。该模型是一个在高计算效率与卓越推理和代理性能之间取得平衡的模型。实现了顶尖性能与超高推理效率的完美平衡，该模型在编程、数学、推理及多语言理解等核心任务上展现出卓越能力，是面向开发者与企业的高级智能助手。 64badd7229504be5a44123367666a51f DeepSeekV3.2（体验版） DeepSeekV3.2是深度求索（DeepSeek）开源的最新一代旗舰级通用大模型。该模型是一个在高计算效率与卓越推理和代理性能之间取得平衡的模型。实现了顶尖性能与超高推理效率的完美平衡，该模型在编程、数学、推理及多语言理解等核心任务上展现出卓越能力，是面向开发者与企业的高级智能助手。 2656053fa69c4c2d89c5a691d9d737c3 Qwen3Coder480BA35BInstruct Qwen3Coder480BA35BInstruct是阿里通义千问开源的顶尖代码大模型，采用混合专家（MoE）架构，总参 4800 亿、激活 350 亿参数，实现性能与成本的平衡，能处理仓库级代码与跨文件依赖。 e8ffc9d7e2b34a7487b30d6682207376 Qwen3235BA22BInstruct2507 Qwen3235BA22BInstruct2507是阿里通义千问发布的开源 MoE 架构大模型，总参 2350 亿、激活 220 亿参数，在指令遵循、推理、编码等多领域性能突出，覆盖 100 多种语言与长尾知识。 aab61a64c8504336848e1720bd379ed4 KimiK2Instruct Kimi K2 是一款先进的混合专家（MoE）语言模型，激活参数为 320 亿，总参数为 1 万亿。通过 Muon 优化器进行训练，Kimi K2 在前沿知识、推理和编码任务上表现出色，同时精心优化了代理能力。 38a6a77904264b3dac4644aedb0e5ced Qwen330BA3B Qwen3是Qwen 系列最新一代大型语言模型，提供了一系列密集型和专家混合（MoE）模型。基于广泛的训练，Qwen3 在推理、指令执行、代理能力和多语言支持方面实现了突破性进展 4efd64f3736d41a08f89db919dbe9c6b BGERerankerLarge BGERerankerLarge是北京智源人工智能研究院（BAAI）发布的一款基于深度学习的重排序模型，能够在中英文两种语言环境下，对检索结果进行优化，提高检索的准确性和相关性。与嵌入模型不同，Reranker使用question和document作为输入，直接输出相似度而不是嵌入。 0cb4c1ed8f374eadbe8bffe30bd039dc BaichuanM232B BaichuanM232B是百川 AI 的医疗增强推理模型，是百川发布的第二个医疗模型。该模型专为现实世界的医疗推理任务设计，在 Qwen2.532B的基础上引入了创新的大型验证系统。通过对真实医疗问题的领域特定微调，它在保持强大通用能力的同时实现了突破性的医疗性能。 9488c08cf627421aacdeb44bd9c2f95c DeepSeekV3.1 DeepSeekV3.1是一个支持思考模式和非思考模式的混合模型。是在 DeepSeekV3.1Base 的基础上进行后训练得到的，后者是通过两阶段长上下文扩展方法在原始 V3 基础检查点上构建的，遵循了原始 DeepSeekV3 报告中概述的方法。通过收集额外的长文档并大幅扩展两个训练阶段来扩大的数据集。 37d1d0f4183b4800a44a69abf9102dfa DeepSeekV30324 DeepSeekV30324是DeepSeek团队于2025年3月24日发布的DeepSeekV3语言模型的新版本。是一个专家混合（MoE）语言模型，总参数为6710亿个，每个Token激活了370亿个参数。0324版本开创了一种用于负载均衡的辅助无损策略，并设定了多令牌预测训练目标以提高性能。该模型版本在几个关键方面比其前身DeepSeekV3有了显著改进。 11bd888a35434486bf209066c7dad0ee DeepSeekR10528 DeepSeekR10528是DeepSeek团队推出的最新版模型。模型基于 DeepSeekV30324 训练，参数量达660B。该模型通过利用增加的计算资源并在后训练期间引入算法优化机制，显著提高了其推理和推理能力的深度。该模型在各种基准测试评估中表现出出色的性能，包括数学、编程和一般逻辑。它的整体性能现在接近 O3 和 Gemini 2.5 Pro 等领先机型。 ff3f5c450f3b459cbe5d04a5ea9b2511 DeepSeekR1 DeepSeekR1 是一款具有创新性的大语言模型，由杭州深度求索人工智能基础技术研究有限公司开发。该模型基于 transformer 架构，通过对海量语料数据进行预训练，结合注意力机制，能够理解和生成自然语言。它经过监督微调、人类反馈的强化学习等技术进行对齐，具备语义分析、计算推理、问答对话、篇章生成、代码编写等多种能力。R1 模型在多个 NLP 基准测试中表现出色，具备较强的泛化能力和适应性。 4bd107bff85941239e27b1509eccfe98 DeepSeekV3 DeepSeekV3是DeepSeek团队开发的新一代专家混合（MoE）语言模型，共有671B参数，在14.8万亿个Tokens上进行预训练。该模型采用多头潜在注意力（MLA）和DeepSeekMoE架构，继承了DeepSeekV2模型的优势，并在性能、效率和功能上进行了显著提升。 9dc913a037774fc0b248376905c85da5 DeepSeekR1DistillLlama70B DeepSeekR1DistillLlama70B是基于Llama架构并经过强化学习和蒸馏优化开发的高性能语言模型。该模型融合了DeepSeekR1的先进知识蒸馏技术与Llama70B模型的架构优势。通过知识蒸馏，在保持较小参数规模的同时，具备强大的语言理解和生成能力。 515fdba33cc84aa799bbd44b6e00660d DeepSeekR1DistillQwen32B DeepSeekR1DistillQwen32B是通过知识蒸馏技术从DeepSeekR1模型中提炼出来的小型语言模型。它继承了DeepSeekR1的推理能力，专注于数学和逻辑推理任务，但体积更小，适合资源受限的环境。 b383c1eecf2c4b30b4bcca7f019cf90d Baichuan2Turbo BaichuanTurbo系列模型是百川智能推出的大语言模型，采用搜索增强技术实现大模型与领域知识、全网知识的全面链接。 43ac83747cb34730a00b7cfe590c89ac Qwen272BInstruct Qwen2 是 Qwen 大型语言模型的新系列。Qwen2发布了5个尺寸的预训练和指令微调模型，包括Qwen20.5B、Qwen21.5B、Qwen27B、Qwen257BA14B以及Qwen272B。这是指令调整的 72B Qwen2 模型，使用了大量数据对模型进行了预训练，并使用监督微调和直接偏好优化对模型进行了后训练。 2f05789705a64606a552fc2b30326bba ChatGLM36B ChatGLM36B 是 ChatGLM 系列最新一代的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，ChatGLM36B 引入了更强大的基础模型、更完整的功能支持、更全面的开源序列几大特性。 7450fa195778420393542c7fa13c6640 TeleChat12B 星辰语义大模型TeleChat是由中电信人工智能科技有限公司研发训练的大语言模型，TeleChat12B模型基座采用3万亿 Tokens中英文高质量语料进行训练。TeleChat12Bbot在模型结构、训练数据、训练方法等方面进行了改进，在通用问答和知识类、代码类、数学类榜单上相比TeleChat7Bbot均有大幅提升。 fdc31b36028043c48b15131885b148ce Llama38BInstruct Meta 开发并发布了 Meta Llama 3 系列大型语言模型（LLM），包含 8B 和 70B 两种参数大小，Llama38BInstruct 是经过指令微调的版本，针对对话用例进行了优化，在常见的行业基准测试中优于许多可用的开源聊天模型。 bda59c34e4424598bbd5930eba713fbf Llama370BInstruct Meta 开发并发布了 Meta Llama 3 系列大型语言模型（LLM），包含 8B 和 70B 两种参数大小，Llama370BInstruct 是经过指令微调的版本，针对对话用例进行了优化，在常见的行业基准测试中优于许多可用的开源聊天模型。 6192ed0cb6334302a2c32735dbbb6ce3 QwenVLChat QwenVLChat模型是在阿里云研发的大规模视觉语言模型 QwenVL 系列的基础上，使用对齐机制打造的视觉AI助手，该模型有更优秀的中文指令跟随，支持更灵活的交互方式，包括多图、多轮问答、创作等能力。 e8c39004ff804ca699d47b9254039db8 StableDiffusionV2.1 StableDiffusionV2.1是由 Stability AI 公司推出的基于深度学习的文生图模型，它能够根据文本描述生成详细的图像，同时也可以应用于其他任务，例如图生图，生成简短视频等。 40f9ae16e840417289ad2951f5b2c88f DeepseekV2LiteChat DeepseekV2LiteChat是一款强大的开源专家混合（MoE）语言聊天模型，具有16B参数，2.4B活动参数，使用5.7T令牌从头开始训练，其特点是同时具备经济的训练和高效的推理。 0855b510473e4ec3a029569853f64974 Qwen2.572BInstruct Qwen2.5系列发布了许多基本语言模型和指令调整语言模型，参数范围从0.5到720亿个参数不等。Qwen2.572BInstruct模型是Qwen2.5系列大型语言模型指令调整版本。 d9df728b30a346afb74d2099b6c209aa Gemma29BIT Gemma29BIT是Google最新发布的具有90亿参数的开源大型语言模型的指令调优版本。模型在大量文本数据上进行预训练，并且在性能上相较于前一代有了显著提升。该版本的性能在同类产品中也处于领先地位，超过了Llama38B和其他同规模的开源模型。 4dae2b9727db46b7b86e84e8ae6530a9 Llama3.23BInstruct Meta Llama3.2多语言大型语言模型（LLMs）系列是一系列预训练及指令微调的生成模型，包含1B和3B参数规模。Llama3.2指令微调的纯文本模型专门针对多语言对话应用场景进行了优化，包括代理检索和摘要任务。它们在通用行业基准测试中超越了许多可用的开源和闭源聊天模型。这是Llama3.23BInstruct版本。 f7d0baa95fd2480280214bfe505b0e2e ChatGLM36B32K ChatGLM36B32K模型在ChatGLM36B的基础上进一步强化了对于长文本的理解能力，能够更好的处理最多32K长度的上下文。具体对位置编码进行了更新，并设计了更有针对性的长文本训练方法，在对话阶段使用 32K 的上下文长度训练。 98b6d84f6b15421886d64350f2832782 CodeGemma7BIT CodeGemma是构建在Gemma之上的轻量级开放代码模型的集合。CodeGemma7BIT模型是CodeGemma系列模型之一，是一种文本到文本和文本到代码的解码器模型的指令调整变体，具有70亿参数，可用于代码聊天和指令跟随。 fa8b78d2db034b6798c894e30fba1173 Qwen2.5Math7BInstruct Qwen2.5Math系列是数学专项大语言模型Qwen2Math的升级版。系列包括1.5B、7B、72B三种参数的基础模型和指令微调模型以及数学奖励模型Qwen2.5MathRM72B，Qwen2.5Math7BInstruct的性能与Qwen2Math72BInstruct相当。 ea056b1eedfc479198b49e2ef156e2aa DeepSeekCoderV2LiteInstruct DeepSeekCoderV2LiteInstruct是一款强大的开源专家混合（MoE）语言聊天模型，具有16B参数，2.4B活动参数。该模型基于DeepSeekV2进一步预训练，增加了6T Tokens，可在特定的代码任务中实现与GPT4Turbo相当的性能。 f23651e4a8904ea589a6372e0e860b10 BGEm3 BGEm3是智源发布的通用语义向量模型BGE家族新成员，支持超过100种语言，具备领先的多语言、跨语言检索能力，全面且高质量地支撑“句子”、“段落”、“篇章”、“文档”等不同粒度的输入文本，最大输入长度为8192，并且一站式集成了稠密检索、稀疏检索、多向量检索三种检索功能，在多个评测基准中达到最优水平。 46c1326f63044fbe80443af579466fe3 Qwen27BInstruct Qwen27BInstruct是 Qwen2大型语言模型系列中覆盖70亿参数的指令调优语言模型，支持高达 131,072 个令牌的上下文长度，能够处理大量输入。 0e97efbf3aa042ebbaf0b2d358403b94 Qwen3235BA22B Qwen3235BA22B是Qwen3系列大型语言模型的旗舰模型。拥有2350多亿总参数和220多亿激活参数。在代码、数学、通用能力等基准测试中，与DeepSeekR1、o1、o3mini、Grok3和Gemini2.5Pro等顶级模型相比，表现出极具竞争力的结果。 35af69e0d4af492ca366cf2df03c3172 Qwen332B Qwen3是Qwen系列中最新一代的大型语言模型，提供一整套密集（Dense）模型和混合专家（MoE）模型。Qwen3基于广泛的培训而构建，在推理、指令遵循、代理功能和多语言支持方面取得了突破性的进步。Qwen332B是参数量为32.8B的密集（Dense）模型。 3836b8d2ec5d46fc94cc7891064940aa Qwen314B Qwen3是Qwen系列中最新一代的大型语言模型，提供一整套密集（Dense）模型和混合专家（MoE）模型。Qwen3基于广泛的培训而构建，在推理、指令遵循、代理功能和多语言支持方面取得了突破性的进步。Qwen314B是参数量为14.8B的密集（Dense）模型。 5873b698960f45c8ae36e72566f7f141 Qwen38B Qwen3是Qwen系列中最新一代的大型语言模型，提供一整套密集（Dense）模型和混合专家（MoE）模型。Qwen3基于广泛的培训而构建，在推理、指令遵循、代理功能和多语言支持方面取得了突破性的进步。Qwen38B是参数量为82亿的密集（Dense）模型。 dceefe3233794dd385e3c2ab500dc6c8 Qwen34B Qwen3是Qwen 系列最新一代大型语言模型，提供了一系列密集型和专家混合（MoE）模型。基于广泛的训练，Qwen3 在推理、指令执行、代理能力和多语言支持方面实现了突破性进展 8606056bfe0c49448d92587452d1f2fc QwQ32B QwQ32B是一款拥有 320 亿参数的推理模型，其性能可与具备 6710 亿参数（其中 370 亿被激活）的 DeepSeekR1 媲美。该模型集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。 b9293363bfbf4db2bccb839ff4300d17 Qwen2.5VL72BInstruct Qwen2.5VL72BInstruct模型是阿里云通义千问开源的全新视觉模型，具有720亿参数规模，以满足高性能计算场景的需求。目前共推出3B、7B、32B和72B四个尺寸的版本。这是旗舰版Qwen2.5VL72B的指令微调模型，在13项权威评测中夺得视觉理解冠军，全面超越GPT40与Claude3.5。 88003ac1ca7a4e4e8efa7caee648323b

来自：
帮助文档
Token服务（原模型推理服务）
API参考
推理服务API
API列表
命名空间管理
参数说明命名空间名称必填，可自定义填写命名空间名称，支持非@、、$、%、^、&和，且不超过128个字符。命名空间ID 可选，仅支持大小写字母、数字、短划线（）和下划线（）,且不超过128个字符。命名空间ID必须唯一。

来自：
帮助文档
微服务引擎
用户指南
注册配置中心
使用注册配置中心
命名空间管理

天翼云最新活动

云聚517 · 好价翼起拼

爆款云主机低至25.83元/年，参与拼团享更多优惠，拼成得额外优惠券

安全隔离版OpenClaw

OpenClaw云服务器专属“龙虾“套餐低至1.5折起

聚力AI赋能天翼云大模型专项

大模型特惠专区·Token Plan 轻享包低至9.9元起

青云志云端助力计划

一站式科研助手，海外资源安全访问平台，助力青年翼展宏图，平步青云

企业出海解决方案

助力您的业务扬帆出海，通达全球！

天翼云信创专区

“一云多芯、一云多态”,国产化软件全面适配，国产操作系统及硬件芯片支持丰富

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云

天翼云最新活动

产品推荐

弹性云主机 ECS

GPU云主机

轻量型云主机

训推服务

应用托管

知识库问答

人脸检测

人脸活体检测

人脸比对

推荐文档

查看监控指标

入驻条件

文档下载

云课堂第十一课：天翼云虚拟IP地址及其在高可用集群中

产品定义

活动

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云

天翼云最新活动

产品推荐

弹性云主机 ECS

GPU云主机

轻量型云主机

训推服务

应用托管

知识库问答

人脸检测

人脸活体检测

人脸比对

推荐文档

查看监控指标

入驻条件

文档下载

云课堂 第十一课：天翼云虚拟IP地址及其在高可用集群中

产品定义

云课堂第十一课：天翼云虚拟IP地址及其在高可用集群中