产品特性
更新时间 2026-04-09 14:41:45
最近更新时间: 2026-04-09 14:41:45
本文带您了解天翼云弹性高性能计算的功能特性。
高性能计算平台
集群管理
支持用户快速创建、删除集群,查看集群内部详细信息。您可以根据需要组建云上弹性高性能计算集群,并且可以随时监控集群状态和CPU使用情况,操作简单,方便管理。
节点管理
支持用户对集群内节点进行新增、删除等操作。您可以实时监控节点的运行状态,在节点出现故障时及时发现问题进行排错。
用户管理
支持用户在集群中增加、删除用户,您可以在同一集群中添加多个用户,分别使用不同的用户提交不同的作业,避免作业之间互相干扰。
作业调度
当前版本支持您通过命令行、Portal页面提交作业。平台提供作业管理调度能力,根据作业的等待时长、申请资源数量、优先级等信息,对作业进行统一的编排,避免资源的冲突,同时提高集群资源利用率,保证用户作业公平合理地共享集群资源。
实时监控
平台支持多维度的系统监控,监控内容包括集群、节点、作业的 CPU 使用率、内存使用率、负载使用率及slot 使用率等信息,帮助您及时了解集群运行状况。
自动伸缩
自动伸缩可以根据您配置的伸缩策略动态调整集群规模,系统可以根据调度器感知的作业等待或节点闲置情况,自动扩容或缩容计算节点,可以帮您合理利用资源,优化使用成本。
高性能计算集群
超强计算能力
集群节点配备高性能 CPU 和 GPU,单集群可容纳大量节点,提供强大的算力,可满足大规模复杂计算需求,如大规模科学计算、复杂的工业仿真等。
高速低延迟网络
支持同一集群内实例间RDMA网络互联互通,不同集群内实例间RDMA网络相互隔离,大幅提升资源交付灵活性。
灵活资源配置
用户可根据自身业务需求,灵活选择计算节点的数量、类型(如 CPU 节点、GPU 节点)以及存储容量等,实现资源的按需定制,有效避免资源浪费。