ctbatch提交作业(1) 本文介绍了如何使用ctbatch工具提交作业。 1.亲和性简介 在 HPC(高性能计算)场景中,亲和性是指将计算任务与硬件资源(CPU/GPU 等)进行精准匹配调度的能力: 同构亲和性:针对 Intel、鲲鹏、中科海光等同类 CPU 架构,实现任务与物理核 / 处理器插槽(Socket)的绑定。 异构亲和性:针对 NVIDIA GPU(CUDA 架构)、中科海光(RocM 架构)等异构硬件,实现任务与单 GPU、多 GPU 的灵活绑定。 2.ctbatch 传统 HPC 调度需依赖调度器(如 Slurm)+ 编译器 + MPI 通信库的组合适配,且不同调度器(Slurm/PBS)、硬件架构的适配规则不统一,导致任务部署效率低、资源利用率差。 ctbatch是天翼云HPC提交作业工具, 通过抽象化的 CLI 工具,统一不同调度器、硬件架构的亲和性调度逻辑。 shell $ ctbatch [h] [q QUEUENAME] [J JOBNAME] [N NODENUM] [w NODELSIT] [ppn TASKSPERNODE] [c CPUSPERTASK] [g GPUSPERNODE] [t MAXTIME] [exclusive] [mpi] [gpubind] [env] [userdefinedmodule] [norun] [command] 命名参数 说明 q QUEUENAME, queue QUEUENAME 作业队列名, 必填 J, JOBNAME, jobname JOBNAME 作业名, 最长50字符 N NODENUM, nodes NODENUM 节点数, 正整数 w NODELSIT, nodelist NODELSIT 节点列表(逗号分隔) ppn TASKSPERNODE, taskspernode TASKSPERNODE 每节点任务数 c CPUSPERTASK, cpuspertask CPUSPERTASK 每任务CPU核心数 g GPUSPERNODE, gpuspernode GPUSPERNODE 每节点GPU数 t MAXTIME, maxtime MAXTIME 最大运行时间 exclusive 独占 mpi 所用的mpi, OpenMPI, OpenMPIcudaaware gpubind 使用gpu亲和性, mpi和gpu卡映射分为11 1n n1 env 自定义环境变量 userdefinedmodule 自定义需加载的module norun 生成作业脚本 command 执行的程序
来自: