分散式¶
作为分布式作业运行的应用程序的组件。许多
本节中的组件是简单的拓扑结构,这意味着它们定义了
分布式设置中节点的布局,并采用实际的
每组节点 () 运行的二进制文件。specs.Role
- torchx.components.dist 的ddp(image: str, entrypoint: str, resource: Optional[str] = 无,nnodes: int = 1, nproc_per_node: int = 1, base_image: 可选[str] = 无,名称:str = 'test_name',角色:str = 'worker',环境: 可选[Dict[str, str]] = None, *script_args: str) → torchx.specs.api.AppDef[来源]¶
分布式数据并行风格的应用程序(一个角色,多副本)。
- 参数
image (图像) – 容器镜像。
entrypoint – 要在映像中运行的脚本或二进制文件。
resource (资源) – 已注册的命名资源。
nnodes – 节点数。
nproc_per_node – 每个节点的进程数。
name (名称) – 应用程序的名称。
base_image – 容器基础映像(不需要)。
role (角色) – ddp 角色的名称。
script – 主脚本。
env – 环境变量。
script_args – 脚本参数。
- 返回
Torchx 应用防御
- 返回类型