Linux aarch64 上的 TorchServe - 实验性
对于一些示例,TorchServe 已经过测试,可以在 linux aarch64 上运行。
在 Amazon Graviton 3 实例 (m7g.4x.large) 上对此进行了测试
安装
当前从 PyPi 安装或从源安装工作
python ts_scripts/install_dependencies.py
pip install torchserve torch-model-archiver torch-workflow-archiver
优化
您还可以为 Graviton 3 启用此优化,以获得改进的性能。更多详细信息可以在此博客中找到
export DNNL_DEFAULT_FPMATH_MODE=BF16
export LRU_CACHE_CAPACITY=1024
例
这个关于文本到语音合成的示例被验证可以在 Graviton 3 上运行
待办事项
词
回归测试