Ubuntu系统如何管理PyTorch依赖
导读:Ubuntu 下管理 PyTorch 依赖的实用指南 一 环境隔离与基础准备 建议使用虚拟环境隔离不同项目的依赖,常用工具有 venv 与 conda。 系统准备与常用命令示例: 更新系统并安装基础工具: sudo apt update...
Ubuntu 下管理 PyTorch 依赖的实用指南
一 环境隔离与基础准备
- 建议使用虚拟环境隔离不同项目的依赖,常用工具有 venv 与 conda。
- 系统准备与常用命令示例:
- 更新系统并安装基础工具:
sudo apt update & & sudo apt install -y python3 python3-pip python3-venv - 使用 venv 创建与激活环境:
python3 -m venv ~/venvs/pt310
source ~/venvs/pt310/bin/activate - 使用 conda 创建与激活环境:
conda create -n pt310 python=3.10 -y
conda activate pt310
- 更新系统并安装基础工具:
- 说明:venv 轻量、系统级依赖少;conda 可同时管理 Python 与 CUDA/cuDNN 等二进制依赖,便于复现实验环境。
二 安装 PyTorch 与匹配依赖
- 选择安装方式
- pip:安装预编译的 wheel 包,简单通用;GPU 版本需系统具备兼容的 NVIDIA 驱动。
- conda:可用 cudatoolkit/cuDNN 与 PyTorch 一同安装,减少系统层面配置负担。
- 常用安装命令(示例,按你的 CUDA 或 CPU 选择其一)
- CPU 版本:
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu - GPU 版本(示例一,CUDA 12.1):
pip install torch==2.1.0+cu121 torchvision==0.16.0+cu121 torchaudio==2.1.0+cu121 --index-url https://download.pytorch.org/whl/cu121 - GPU 版本(示例二,CUDA 12.6):
pip install torch==2.6.0+cu126 torchvision==0.17.0+cu126 torchaudio==2.6.0+cu126 --index-url https://download.pytorch.org/whl/cu126 - conda 方式(会自动拉取 cudatoolkit 等):
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
- CPU 版本:
- 版本匹配要点
- 保持 torch / torchvision / torchaudio 的版本一致(如均为 2.6.0 或均为 2.1.0)。
- 选择与驱动匹配的 CUDA 版本;若使用 pip 的 GPU 包,仍需系统安装兼容的 NVIDIA 驱动。
三 验证安装与常见依赖问题排查
- 验证命令(在激活的虚拟环境中执行):
python - < < ‘PY’ import torch, sys print(“torch:”, torch.version, “cuda:”, torch.version.cuda) print(“cuda available:”, torch.cuda.is_available()) print(“device count:”, torch.cuda.device_count()) if torch.cuda.is_available(): print(“device name:”, torch.cuda.get_device_name(0)) PY - 常见问题与处理
- torch.cuda.is_available() 为 False
- 可能原因:未装 NVIDIA 驱动、驱动版本与 CUDA 不匹配、使用了 CPU 版本的 PyTorch、未在 GPU 环境运行。
- 处理:确认驱动与 CUDA 兼容;必要时重装匹配版本的 PyTorch(如从 CPU 切换到 +cu121 或 +cu126 的 GPU 版本)。
- 版本冲突或不一致
- 处理:在独立虚拟环境中重装;固定版本号(如 torch==2.6.0+cu126 等),避免混用 pip 与 conda 的已安装二进制包。
- 构建/编译扩展时报错
- 处理:安装构建依赖(如 build-essential、cmake、git、numpy、pyyaml、mkl 等),再重试安装或编译。
- torch.cuda.is_available() 为 False
四 依赖记录与团队协作
- requirements.txt(pip)
- 固定精确版本与索引源,便于复现:
torch==2.6.0+cu126
torchvision==0.17.0+cu126
torchaudio==2.6.0+cu126
–extra-index-url https://download.pytorch.org/whl/cu126
- 固定精确版本与索引源,便于复现:
- environment.yml(conda)
- 示例:
name: pt310
channels:- pytorch
- nvidia
- defaults
dependencies: - python=3.10
- pytorch=2.1.0
- torchvision=0.16.0
- torchaudio=0.16.0
- pytorch-cuda=12.1
- 示例:
- 建议使用 虚拟环境 + 固定版本 + 锁文件(requirements.txt 或 environment.yml),并在仓库根目录记录硬件与驱动信息(如 nvidia-smi 输出),提升可复现性与协作效率。
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: Ubuntu系统如何管理PyTorch依赖
本文地址: https://pptw.com/jishu/784706.html
