TorchRL¶
TorchRL 是 PyTorch 的开源强化学习 (RL) 库。
您可以直接从 PyPI 安装 TorchRL(请参阅有关安装的更多信息 说明):
$ pip install torchrl
TorchRL 为 RL 提供了 pytorch 和 python 优先、低级和高级抽象,这些抽象旨在实现高效、模块化、文档化和适当测试。 该代码旨在支持 RL 研究。其中大部分是以高度模块化的方式用 python 编写的,因此研究人员可以轻松交换组件、转换组件或编写新组件。
这个仓库试图与现有的 pytorch 生态系统库保持一致,因为它有一个 “数据集支柱”(环境)、转换、模型、 数据实用程序(例如收集器和容器)等。 TorchRL 旨在具有尽可能少的依赖项(python 标准库、numpy 和 pytorch)。 常见的环境库(例如 OpenAI gym)是可选的。
在低级端,torchrl 带有一组高度可重用的函数 用于成本函数、返回值和数据处理。
TorchRL 的目标是高模块化和良好的运行时性能。
要详细了解此 API 参考之外的 TorchRL 理念和功能, 检查 TorchRL 论文。
安装¶
TorchRL 版本与 PyTorch 同步,因此请确保您始终享受最新的 具有最新版本的 PyTorch 的库的功能(尽管 保证向后兼容 pytorch>=2.0)。 Nightly 版本可以通过以下方式安装
$ pip install tensordict-nightly
$ pip install torchrl-nightly
或者如果您愿意为库做出贡献,则通过 a:git clone
$ cd path/to/root
$ git clone https://github.com/pytorch/tensordict
$ git clone https://github.com/pytorch/rl
$ cd tensordict
$ python setup.py develop
$ cd ../rl
$ python setup.py develop
开始¶
一系列快速教程,用于快速掌握 库。如果您赶时间,您可以从该系列的最后一项开始,然后在您想了解更多信息时导航到前面的项目!