产品动态
更新时间 2026-01-16 00:00:00
最近更新时间: 2026-01-16 00:00:00
2026年1月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2026/01/16 | 缓存推理上线、调用监控优化 | 1. 缓存命中能力上线,降低输入token成本,目前支持DeepSeek-V3.1模型。
2. 调用监控优化,支持细分筛选不同计费类型下的调用量。 |
2025年12月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2025/12/17 | 批量推理上线、调用监控更新 | 1. 批量推理(Batch Inference)功能上线,可通过离线方式进行大规模数据处理。
2. 调用监控支持分推理类型查看监控指标、支持按照服务组导出监控数据、支持按付费类型查看token用量。 | |
2025/12/05 | 模型上新 | 模型推理服务平台DeepSeek-V3.2模型上线,支持按token计费。 |
2025年11月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2025/11/25 | 模型上新 | 模型推理服务平台Qwen3-Coder-480B-A35B-Instruct、Qwen3-235B-A22B-Instruct-2507、Kimi-K2-Instruct模型上线,支持按token计费。 |
2025年10月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2025/10/17 | MCP、闲时推理上线 | MCP聚合优质资源,扩展模型边界,支持体验和部署MCP服务;
DeepSeek-R1、DeepSeek-V3.1等模型推出优惠时段价格,在优惠时段内的请求按优惠价格计费。 |
2025年9月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2025/09/09 | 模型推理服务上线 | 模型推理服务为大模型训练、推理、应用提供全栈工具链,包含模型体验、模型定制、模型服务、插件服务等模块。预置丰富的基座大模型和数据集,支持国产化等异构算力,提供算子加速与模型加速,极大提升大模型训练推理效率。 |