按需计费模式-Tokens 一站式智算服务平台支持包周期和卡时/Token按需计费三种计费模式。本节为您详细介绍Token按需计费模式。 Token 概念 在模型服务中,一个核心概念是“token”。当您调用模型进行推理服务时,输入内容会首先经过分词处理,转换成模型能够识别的token形式。随后,这些token经过模型的处理,再以token的形式输出,并最终转化为您所需的文本。 模型服务费用 token 使用数量 token 单价 说明 不同的模型可能采用不同的分词策略,同一段文本在不同模型上的 tokens 计量会存在差异。 产品价格 按 token 使用量付费 出账时间:每小时出账。 付款类型:按量后付费。 免费额度:使用模型时,将优先消耗免费额度,免费额度耗尽后,调用将会失败;如需继续使用,需要手动开通对应的模型付费服务。 模型单价(刊例价):如下表,实际购买价格以下单页面为准。 模型名称 服务类型 计费单位 (元/百万tokens) 免费额度(tokens) DeepSeek系列 DeepSeekR1 输入 4 每个模型可免费使用2500万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 DeepSeek系列 DeepSeekR1 输出 16 每个模型可免费使用2500万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 DeepSeek系列 DeepSeekV3 输入 2 每个模型可免费使用2500万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 DeepSeek系列 DeepSeekV3 输出 8 每个模型可免费使用2500万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 DeepSeek系列 DeepSeekR1DistillLlama70B 输入 4.1 每个模型可免费使用2500万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 DeepSeek系列 DeepSeekR1DistillLlama70B 输出 4.1 每个模型可免费使用2500万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 DeepSeek系列 DeepSeekR1DistillQwen32B 输入 1.3 每个模型可免费使用2500万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 DeepSeek系列 DeepSeekR1DistillQwen32B 输出 1.3 每个模型可免费使用2500万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 Qwen系列 Qwen2.572Binstruct 输入 4.13 每个模型可免费使用100万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 Qwen系列 Qwen2.572Binstruct 输出 4.13 每个模型可免费使用100万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 Qwen系列 QwenVLChat 输入 0.8 每个模型可免费使用100万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 Qwen系列 QwenVLChat 输出 1.6 每个模型可免费使用100万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 Qwen系列 Qwen2.5VL72BInstruct 输入 4.13 每个模型可免费使用100万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 Qwen系列 Qwen2.5VL72BInstruct 输出 4.13 每个模型可免费使用100万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 Qwen系列 Qwen314B 输入 0.8 每个模型可免费使用100万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 Qwen系列 Qwen314B 输出 1.6 每个模型可免费使用100万tokens,从第一次使用开始限期两周。免费额度用完或到期后,可以付费开通服务。 其他系列 每个模型可免费使用100万tokens,用尽后不支持tokens计费模式,可以通过按卡时计费模式下单。