当前位置：首页 > news >正文

在Windows系统上安装PyTorch GPU版：从零到成功运行的过程记录

news 2026/7/2 11:35:03

作为深度学习研究者或开发者，能够利用GPU加速模型训练是提高工作效率的关键。本文将详细介绍如何在Windows系统上成功安装并配置PyTorch GPU版本，让你能够充分利用NVIDIA显卡的计算能力。

第一步：检查当前系统环境

在开始安装之前，我们首先需要了解当前的硬件和驱动情况。

1.1 查看GPU信息

打开命令提示符（CMD）或PowerShell，输入以下命令：

nvidia-smi

根据你的输出，我们可以看到：

+-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 551.86 Driver Version: 551.86 CUDA Version: 12.4 | |-----------------------------------------+------------------------+----------------------+ | GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA GeForce RTX 3050 WDDM | 00000000:01:00.0 On | N/A | | 31% 30C P8 4W / 70W | 1337MiB / 6144MiB | 6% Default | +-----------------------------------------+------------------------+----------------------+

关键信息解读：

驱动版本: 551.86
CUDA版本: 12.4
GPU型号: NVIDIA GeForce RTX 3050
显存: 6GB

1.2 检查Python版本

确保你已经安装了Python 3.8（或其他兼容版本）：

python --version

第二步：安装CUDA Toolkit

2.1 下载合适的CUDA版本

根据nvidia-smi显示的CUDA版本（12.4），我们需要安装对应的CUDA Toolkit：

访问NVIDIA CUDA Toolkit Archive
选择CUDA 12.4版本（与驱动兼容）
选择Windows系统对应的安装包

2.2 安装CUDA Toolkit

运行下载的安装程序
选择"自定义安装"
建议保持默认选项，但可以取消Visual Studio集成（如果你不需要）
完成安装后，验证安装：

nvcc --version

第三步：安装cuDNN

3.1 下载cuDNN

访问cuDNN Archive
选择与CUDA 12.4兼容的cuDNN版本
需要注册NVIDIA账户（免费）

3.2 安装cuDNN

下载ZIP文件后解压
将解压后的文件复制到CUDA安装目录：
- 将bin文件夹内容复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\bin
- 将include文件夹内容复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\include
- 将lib文件夹内容复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\lib

第四步：安装PyTorch GPU版本

4.1 选择合适的PyTorch版本

由于我们使用的是CUDA 12.1/12.4，建议使用对应的PyTorch版本。

4.2 使用pip安装

打开命令提示符或PowerShell，运行以下命令：

pipinstalltorch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 --trusted-host download.pytorch.org

参数说明：

--index-url: 指定PyTorch的CUDA 12.1版本仓库
--trusted-host: 信任该主机，避免SSL验证问题

注意：虽然nvidia-smi显示CUDA 12.4，但PyTorch官方提供的是CUDA 12.1版本，这两个版本通常是兼容的。

4.3 替代安装方法

如果你遇到网络问题，可以使用清华镜像源：

pipinstalltorch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple

第五步：验证安装

5.1 创建测试脚本

创建一个Python文件（如test_gpu.py），包含以下代码：

importtorchprint("=== PyTorch GPU检测 ===")print(f"PyTorch版本:{torch.__version__}")print(f"CUDA是否可用:{torch.cuda.is_available()}")print(f"CUDA版本:{torch.version.cuda}")iftorch.cuda.is_available():print(f"GPU数量:{torch.cuda.device_count()}")foriinrange(torch.cuda.device_count()):print(f"\n--- GPU{i}---")print(f"名称:{torch.cuda.get_device_name(i)}")print(f"内存总量:{torch.cuda.get_device_properties(i).total_memory/1e9:.2f}GB")print(f"当前内存使用:{torch.cuda.memory_allocated(i)/1e9:.2f}GB")print(f"最大内存使用:{torch.cuda.max_memory_allocated(i)/1e9:.2f}GB")# 简单张量计算测试print("\n=== GPU计算测试 ===")device=torch.device("cuda"iftorch.cuda.is_available()else"cpu")x=torch.randn(10000,10000).to(device)y=torch.randn(10000,10000).to(device)z=torch.matmul(x,y)print(f"矩阵计算完成，结果形状:{z.shape}")print("✅ GPU加速工作正常！")else:print("\n❌ CUDA不可用！可能的原因：")print("1. 没有安装CUDA版本的PyTorch")print("2. NVIDIA驱动太旧")print("3. PyTorch与CUDA版本不匹配")print("4. CUDA/cuDNN没有正确安装")print("5. 系统PATH环境变量未正确配置")

5.2 运行测试

python test_gpu.py

5.3 预期成功输出

=== PyTorch GPU检测 === PyTorch版本: 2.3.0+cu121 CUDA是否可用: True CUDA版本: 12.1 --- GPU 0 --- 名称: NVIDIA GeForce RTX 3050 内存总量: 6.00 GB 当前内存使用: 0.00 GB 最大内存使用: 0.00 GB === GPU计算测试 === 矩阵计算完成，结果形状: torch.Size([10000, 10000]) ✅ GPU加速工作正常！

第六步：常见问题解决

6.1 CUDA不可用

如果torch.cuda.is_available()返回False：

检查驱动版本：确保NVIDIA驱动是最新的
验证CUDA安装：运行nvcc --version确认CUDA已安装
检查环境变量：确保CUDA路径已添加到系统PATH
重新安装PyTorch：使用正确的CUDA版本

6.2 安装速度慢

使用国内镜像源
使用conda安装（如果需要）：

condainstallpytorch torchvision torchaudio pytorch-cuda=12.1-c pytorch -c nvidia

6.3 版本冲突

如果遇到版本冲突，建议创建虚拟环境：

# 创建虚拟环境python -m venv pytorch_gpu# 激活虚拟环境（Windows）pytorch_gpu\Scripts\activate# 在虚拟环境中安装pipinstalltorch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

第七步：性能优化建议

7.1 设置GPU内存分配策略

# 在代码开头添加torch.cuda.empty_cache()torch.backends.cudnn.benchmark=True# 自动优化卷积算法

7.2 监控GPU使用情况

使用以下命令实时监控GPU状态：

# 每隔1秒刷新一次nvidia-smi -l1

总结

通过以上步骤，你应该已经成功在Windows系统上安装了PyTorch GPU版本。关键要点：

版本匹配至关重要：确保驱动、CUDA、cuDNN和PyTorch版本兼容
按顺序安装：驱动 → CUDA → cuDNN → PyTorch
验证每一步：使用命令行工具验证每个组件的安装
利用虚拟环境：避免包冲突，保持环境清洁

现在你可以开始使用GPU加速的PyTorch进行深度学习项目开发了！如果遇到任何问题，欢迎在评论区留言讨论。

相关资源链接：

PyTorch官方安装指南
NVIDIA驱动下载
CUDA Toolkit Archive
cuDNN Archive

至此记录完毕，respect！

查看全文

http://www.cnnetsun.cn/news/90107.html

【安全专家亲授】私有化Dify的SSL配置秘诀：保障数据传输不被窃取

Vue3+JS 高级前端面试题

海康威视智能工厂，是如何走向“领航”的？

《深入昇腾底层：Ascend C 编程模型与高性能算子开发实战》

实战 Ascend C：从零实现高性能自定义算子

掌握这3种R包，轻松完成空间转录组细胞轨迹建模！

【Dify Tesseract字体适配终极指南】：破解OCR识别失败的9大字体陷阱

Docker + 智能Agent日志管理新思路（仅限高级工程师掌握的3种架构模式）

揭秘空间转录组细胞类型注释：如何用R语言精准识别每一种细胞

[吾爱大神原创工具] 电话号码过滤，号码排序-乱序，清除非手机号，消重，导出（依旧颜值高）

Dify平台Agent版本管理全解析：从入门到高可用架构设计

为什么90%的生物信息分析师都在用R做RNA结构研究？真相令人震惊

【稀缺资源】Dify + Tesseract 5.3多语言支持实现路径首次公开

还在手动写Dify用例？Agent驱动自动化测试已成主流！

RSA 加密体制及其安全性分析

【视频帧提取效率翻倍秘籍】：Dify帧率设置背后的黄金参数揭秘

在C#上运行YOLOv11模型---CPU版

关于uniapp vue2 canvas重绘元素节点时，提示cos of null相关异常警告，导致js线程崩溃，vue响应式丢失的问题

【微服务稳定性提升利器】：基于Dify与Spring AI的异常熔断与恢复策略

concurrent hashmap原理，扩容，扩容时怎么保证线程安全？

空间转录组降维必杀技：5步用R语言完成PCA、t-SNE与UMAP优化

【R语言与量子计算加速新突破】：GPU如何将量子模拟效率提升10倍？

AWS专家Greg Coquillo提出的 6种LLM ORCHESTRATION PATTERNS解析

“.商标”不等同于商标权：企业做知识产权保护，别把“后缀名”当“确权证”

面向削峰填谷的电动汽车多目标优化调度策略

如何在30分钟内完成Dify与Spring AI的无缝部署？资深架构师亲授秘诀

【Vue知识点总结】Vue中的namespaced命名空间详解

告别单一生态限制，构建R-Python一体化可视化工作流

论基于REST服务的Web应用系统设计

R语言在气象数据分析中的应用（相关性建模全攻略）