slurm常用命令
Slurm常用命令
- sacct:显示激活的或已完成作业或作业步的记账(对应需缴纳的机时费)信息。
- salloc:为需实时处理的作业分配资源,典型场景为分配资源并启动一个shell,然后用此shell执行srun命令去执行并行任务。
- sattach:吸附到运行中的作业步的标准输入、输出及出错,通过吸附,使得有能力监控运行中的作业步的IO等。
- sbatch:提交作业脚本使其运行。此脚本一般也可含有一个或多个srun命令启动并行任务。
- sbcast:将本地存储中的文件传递分配给作业的节点上,比如/tmp等本地目录;对于/home等共享目录,因各节点已经是同样文件,无需使用。
- scancel:取消排队或运行中的作业或作业步,还可用于发送任意信号到运行中的作业或作业步中的所有进程。
- scontrol:显示或设定Slurm作业、队列、节点等状态。
- sinfo:显示队列或节点状态,具有非常多过滤、排序和格式化等选项。
- squeue:显示队列中的作业及作业步状态,含非常多过滤、排序和格式化等选项。
- srun:实时交互式运行并行作业,一般用于段时间测试,或者与sallcoc及sbatch结合。