Slurm¶
- torchx.schedulers.slurm_scheduler 类。SlurmScheduler(session_name: str)[来源]¶
SlurmScheduler 是 slurm 的 TorchX 调度接口。TorchX 期望 slurm CLI 工具在本地安装并启用作业核算。
每个应用程序 def 都是通过 sbatch 使用异构作业调度的。 每个角色的每个副本都有一个唯一的 shell 脚本,该脚本使用其 resource allocations 和 args,然后使用 sbatch 来启动所有这些 一起。
日志将写入默认的 slurm 日志文件。
传递给它的任何计划程序选项都将作为 SBATCH 参数添加到每个副本中。
有关详细信息,请参阅:
$ torchx run --scheduler slurm utils.echo --msg hello slurm://torchx_user/1234 $ torchx status slurm://torchx_user/1234 $ less slurm-1234.out ...