数据预热
更新时间 2026-02-11 15:42:04
最近更新时间: 2026-02-11 15:42:04
本节介绍如何预热数据集。
为了保证应用在访问数据时的性能,可以数据集开启加速时,或者加速就绪后,开启数据预热功能。
开启数据预热将同步生成预热资源(DataLoad),通过数据预热,提前将远程存储系统中的数据拉取到靠近计算结点的本地存储中,使得消费该数据集的应用能够在首次运行时即可享受到缓存带来的加速效果。
前提条件
已完成AI套件安装,弹性数据集组件运行正常
确保存储插件cstor-csi运行正常
数据集已开启数据加速
操作步骤
1、加速数据集开启预热
登录云容器引擎管理控制台;
在集群列表页点击进入指定集群;
进入主菜单 智算套件 > AI应用管理 > 数据集 > 私有数据集,选择数据集;
进入数据集详情页 > 版本;
数据集版本列表中,对于已加速数据集,开放“缓存预热”入口。点击“缓存预热”,将开启预热操作。
2、查看预热状态
数据集开启预热之后,首先加速状态置为预热中,此时后台进行预热资源创建,缓存引擎拉取远端数据:
预热完成后,加速状态置为已预热,同时通过列表可以获取已缓存大小和缓存百分比信息:
注意
已缓存大小 = 当前实际缓存的数据量(已使用空间)
已缓存百分比 = 已缓存大小 / 缓存配额 × 100% (当远端数据全部缓存在本地时,缓存百分比为100%)