SLURM介绍 !/bin/bash:声明脚本使用bash解释器 2. SBATCH开头的行:指定资源需求和作业参数 3. 实际要执行的计算命令 示例:创建一个名为hello.slurm的文件: shell !/bin/bash SBATCH jobnamehelloworld 作业名称 SBATCH partitionbatch 提交到batch分区 SBATCH nodes1 请求1个节点 SBATCH ntasks1 1个进程 SBATCH cpuspertask4 每个进程4个CPU核 SBATCH time00:10:00 最大运行10分钟 SBATCH output%j.out 标准输出文件(%j会替换为作业ID) SBATCH error%j.err 标准错误文件 SBATCH nodelistcompute001 指定compute001节点 SBATCH exclusive 指定节点独占 实际执行的命令 echo "Hello, Slurm!" echo "作业ID: $SLURMJOBID" echo "运行节点: $(hostname)" 提交作业: shell sbatch hello.slurm 提交成功后会显示:Submitted batch job 12345,其中12345就是您的作业ID。 常用SBATCH参数速查表: 参数 含义 示例 jobname 作业名称 jobnamemyjob partition 提交到的分区 partitiongpu N, nodes 请求的节点数 N 2 n, ntasks 总进程数 n 8 ntaskspernode 每个节点的进程数 ntaskspernode4 cpuspertask 每个进程的CPU核数 cpuspertask8 gres 请求GPU资源 gresgpu:8(请求8张GPU) time 最大运行时长 time700:00:00(7天) output 标准输出文件 outputoutput%j.log error 标准错误文件 errorerror%j.log