Slurm¶
- class torchx.schedulers.slurm_scheduler.SlurmScheduler(session_name: str)[source]¶
SlurmScheduler 是 TorchX 的一个调度接口,用于 Slurm。TorchX 假设 Slurm 命令行工具已本地安装,并且作业计费已启用。
每个应用程序定义都通过异构作业使用 sbatch 进行调度。 每个角色的每个副本都会生成一个带有其资源分配和参数的唯一 shell 脚本,然后使用 sbatch 一起启动它们。
日志被写入默认的slurm日志文件。
任何传递给它的调度器选项都会作为SBATCH参数添加到每个副本中。
更多信息请参见:
$ torchx run --scheduler slurm utils.echo --msg hello slurm://torchx_user/1234 $ torchx status slurm://torchx_user/1234 $ less slurm-1234.out ...