智算套件 本节介绍了智算套件的用户指南。 前提条件已创建云容器引擎智算版集群。智算套件介绍组件名称组件介绍智能调度为集群提供智能任务调度策略,可支持Gang、Capacity、Binpack/Spread和Queue等智能调度。日志为集群的系统组件以及控制面组件收集日志。弹性训练为集群提供AI任务接入,兼容主流AI框架和工具,包括TensorFlow、PyTorch、Horovod、Spark等。监控为集群提供硬件监控能力,可采集GPU/NPU,显存等,支持可视化查看GPU的分配、使用和健康状态。