产品动态
更新时间 2026-05-09 00:00:00
最近更新时间: 2026-05-09 00:00:00
2026年5月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2026/05/09 | 海光DCU | 支持海光 DCU BW1000 算力卡,覆盖 AI 任务全流程管控,构筑国产化算力解决方案。 | 无 |
2026/05/09 | HPFS-NFS协议 | 数据集和代码支持 HPFS-NFS 协议,提供高性能文件传输能力,保障业务流畅运行。 | 无 |
2026年4月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2026/04/01 | 弹性伸缩 | 基于 GPU 利用率、QPS 核心指标触发自动扩缩容,适配业务流量波动。 | 无 |
2026/04/01 | 节点选择器 | 支持精细化节点筛选调度,实现算力精准分配,提升整体资源利用率。 | 无 |
2026/04/01 | 代码&环境管理 | 支持代码、运行环境全生命周期管控,一键构建版本与编译依赖,加速 AI 应用开发部署。 | 无 |
2026年2月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2026/02/28 | 智能路由 | 具备负载感知、前缀匹配两类核心调度策略,实现流量统一编排、精准分发、全域负载均衡。 | 无 |
2026/02/28 | 模型加速 | 支持RDMA P2P传输加速,摒弃中心化集中拉取模式,依托种子节点 + RDMA P2P 架构,实现模型文件跨节点高速分发。 | 无 |
2026年1月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2026/01/17 | 数据集加速 | 通过数据加速将数据从存储位置缓存到算力近端,有效解决在容器集群中访问存储系统数据时容易出现的高延迟及带宽受限问题,大幅提升训练效率。 | 无 |
2026/01/17 | 资源灵活配置 | 创建AI应用时,资源配置支持 MiB 和 GiB,可更精确的分配硬件资源。 | 无 |
2025年11月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2025/11/29 | PD分离 | AI推理应用支持PD分离,大幅提升AI推理效率,助力客户业务快速落地。 | 无 |
2025/11/08 | 可分配资源监控 | 创建AI应用时,支持可分配资源监控,实现资源精准分配、避免资源过载或闲置,为用户提供实时的资源使用全景视图,让资源分配从 “经验估算” 转变为 “数据驱动”。 | 无 |
2025/11/08 | 定时伸缩 | AI推理应用支持定时伸缩,可根据业务流量的时间规律动态调整算力,有效解决推理集群 “峰时资源不足、谷时资源闲置” 的资源浪费问题,实现资源弹性分配与成本优化的双重目标。 | 无 |
2025年10月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2025/10/18 | AI应用开发 | 支持Notebook(VS Code/JupyterLab)和 TensorBoard,支撑AI应用快速迭代、高效调试。 | 无 |
2025年9月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2025/09/27 | 自定义训推资源 | 支持设置GPU卡、NPU卡、共享显存、算力百分比粒度切分和启动参数,可根据业务自定义训推资源,提升资源利用率。 | 无 |
2025年7月
|
时间节点 |
功能名称 |
功能描述 |
相关文档 |
|---|---|---|---|
2025/07/26 | 智算套件控制台 | 提供AI应用全生命周期管理,支持AI框架、数据集、模型、队列等统一管理,AI任务全链路可观测。 | 无 |