以下是 PyTorch Linux 版的一些新功能:
- 硬件支持方面:
- PyTorch 2.7 原生支持 NVIDIA Blackwell GPU 架构(如 H200、L50S),通过 CUDA 12.8 深度集成、Triton 3.3 编译器等优化,提升多模态模型训练吞吐量、降低显存占用等。
- 2.8 版本有对 Intel GPU 的 XCCL 分布式后端实验支持等。
- 性能优化方面:
- 2.7 版本中 torch.compile 有诸多优化,如解决 Hugging Face 大模型中 CUDA 图重复录制问题、支持区域编译提升 LLM 微调效率等。
- 2.8 版本在 Intel CPU 上通过多种优化提升量化 LLM 推理性能,如支持 FP8 QCONV 等、优化 PT2E 性能等。
- 功能特性方面:
- 2.6 版本引入动态形状支持增强、TorchDynamo 改进等。
- 2.7 版本有 FlexAttention 相关功能增强,如支持 LLM 首个令牌处理、吞吐量模式优化等。