训练¶
训练机器学习模型通常需要自定义训练循环和代码。因此,我们没有提供现成的训练循环应用程序。不过,我们确实有一些示例,展示如何构建您的训练应用程序,以及可以用于运行自定义训练应用程序的通用组件。
参见
torchx.components以了解更多关于编写组件的信息欲了解有关分布式训练的更多信息,请参阅
torchx.components.dist。
嵌入式训练脚本¶
对于简单的应用程序,您可以使用torchx.components.utils.python()
组件将训练脚本作为命令行参数嵌入到Python命令中。这有一定的大小限制,但对于许多较小的应用程序来说是可以工作的。
>>> from torchx.components.utils import python
>>> app = """
... import sys
... print(f"Hello, {sys.argv[0]}")
... """
>>> python("TorchX user", c=app)
AppDef(..., entrypoint='python', ...)