训练¶
训练机器学习模型通常需要自定义训练循环和代码。因此,我们没有提供现成的训练循环应用程序。不过,我们确实有一些示例,展示如何构建您的训练应用程序,以及可以用于运行自定义训练应用程序的通用组件。
注意
请在运行示例之前遵循运行示例的前提条件
查看 训练器应用示例 的代码。 您可以通过在桌面上运行一个单独的训练器示例来尝试它:
python torchx/examples/apps/lightning_classy_vision/train.py
Torchx 通过提供简单易用的 API 来简化应用程序执行,这些 API 标准化了在本地或远程环境中执行应用程序的方式。它通过引入组件的概念来实现这一点。
每个用户应用程序都应该附带相应的组件。 查看单节点训练器代码: 训练器组件
自己试试看:
torchx run -s local_cwd ./torchx/examples/apps/lightning_classy_vision/component.py:trainer
上面的代码将在用户的桌面执行一个单个训练器。 如果你在笔记本电脑上安装了Docker,你可以通过以下命令运行相同的单个训练器:
torchx run -s local_docker ./torchx/examples/apps/lightning_classy_vision/component.py:trainer
你可以了解更多关于自定义组件的内容: torchx.components
Torchx拥有强大的分布式作业执行简化支持,您可以了解更多
torchx.components.dist