PyTorch 1.10正式版上线:Android NNAPI支持来了
新机器视觉
共 2764字,需浏览 6分钟
·
2021-10-25 12:57
点击下方卡片,关注“新机器视觉”公众号
视觉/图像重磅干货,第一时间送达
机器之心报道
广受人们欢迎的深度学习框架 PyTorch 刚刚更新了 1.10 正式版,在 CUDA Graphs API 等方面进行了诸多改进。
集成了 CUDA Graphs API 以减少 CUDA 工作负载的 CPU 开销; FX、torch.special 和 nn.ModuleParametrization 等几个前端 API 已从测试版变为稳定版; 除了 GPU 之外,JIT Compiler 中对自动融合的支持扩展到 CPU; Android NNAPI 支持现已推出测试版。
Remote Module(稳定版):此功能允许用户远程操作模块,就像使用本地模块一样,其中 RPC 对用户是透明的; DDP Communication Hook(稳定版):此功能允许用户覆盖 DDP 如何跨进程同步梯度; ZeroRedundancyOptimizer(稳定版):此功能可与 DistributedDataParallel 结合使用,以减少每个进程优化器状态的大小。
增强型内存视图:这有助于用户更好地了解内存使用; 增强型内核视图:附加列显示网格和块大小以及每个线程共享内存使用和寄存器的情况; 分布式训练:Gloo 现在支持分布式训练工作; TensorCore:该工具显示 Tensor Core(TC) 的使用,并为数据科学家和框架开发人员提供建议; NVTX:对 NVTX markers 的支持是从旧版 autograd profiler 移植过来的; 支持移动设备分析:PyTorch profiler 现在与 TorchScript 、移动后端能够更好的集成,支持移动工作负载的跟踪收集。
—版权声明—
仅用于学术分享,版权属于原作者。
若有侵权,请联系微信号:yiyang-sy 删除或修改!
评论