指标¶
对于指标,我们建议使用 Tensorboard 将指标直接记录到云端 storage 的 intent 和模型一起。当模型训练时,您可以使用启动 tensorboard 实例来监控模型进度:
$ tensorboard --log-dir provider://path/to/logs
有关如何使用 PyTorch 的示例,请参阅 Trainer 应用程序示例 Lightning TensorboardLogger 的 TensorboardLogger 中。
正在通过 https://github.com/pytorch/torchx/issues/128 跟踪 TorchX Tensorboard 内置组件。
参考¶
PyTorch Tensorboard 教程 https://pytorch.org/tutorials/intermediate/tensorboard_tutorial.html
PyTorch Lightning 记录器 https://pytorch-lightning.readthedocs.io/en/stable/extensions/logging.html