Ubuntu Python机器学习应用
导读:在 Ubuntu 上使用 Python 开展机器学习的高效实践 一 环境准备与基础安装 更新系统并安装基础工具: 命令:sudo apt update && sudo apt upgrade -y 安装 Python 与...
在 Ubuntu 上使用 Python 开展机器学习的高效实践
一 环境准备与基础安装
- 更新系统并安装基础工具:
- 命令:sudo apt update & & sudo apt upgrade -y
- 安装 Python 与 pip:sudo apt install python3 python3-pip
- 可选:安装虚拟环境工具:sudo apt install python3-venv
- 建议的硬件与系统基线(以 Ubuntu 24.04 LTS 为例):
- 处理器:64 位 CPU,≥2 核(推荐 ≥4 核)
- 内存:≥8 GB(深度学习推荐 ≥16 GB)
- 存储:≥20 GB 可用空间(SSD 更佳)
- 显卡:可选,NVIDIA GPU(≥4 GB VRAM) 用于加速训练
- 验证安装:
- 查看版本:python3 --version、pip3 --version
二 创建隔离环境与依赖管理
- 使用 venv 创建项目环境(轻量、系统级 Python 推荐):
- 创建:python3 -m venv venv
- 激活:source venv/bin/activate
- 退出:deactivate
- 使用 conda 管理环境(数据科学常用,便于二进制包与 GPU 版本管理):
- 安装 Miniconda/Anaconda(示例):wget https://repo.anaconda.com/archive/Anaconda3-2024.05-Linux-x86_64.sh & & bash Anaconda3-2024.05-Linux-x86_64.sh
- 创建环境:conda create -n ml_env python=3.10
- 激活环境:conda activate ml_env
- 常用依赖安装(在激活的环境中执行):
- 机器学习基础:pip install numpy pandas scikit-learn matplotlib seaborn jupyter
- 图像处理:pip install opencv-python
- 深度学习(按需二选一或并存):
- CPU 版 PyTorch:conda install pytorch torchvision torchaudio cpuonly -c pytorch
- GPU 版 PyTorch(示例 CUDA 11.8):conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
- TensorFlow:pip install tensorflow(GPU 支持取决于 CUDA/cuDNN 与驱动匹配)
三 快速上手示例
- 示例一 传统机器学习(scikit-learn 线性回归)
- 代码示例:
- from sklearn.model_selection import train_test_split
- from sklearn.linear_model import LinearRegression
- from sklearn.metrics import mean_squared_error
- import numpy as np
- X = np.random.rand(100, 1)
- y = 2 + 3 * X + 0.1 * np.random.randn(100, 1)
- X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
- model = LinearRegression(); model.fit(X_train, y_train)
- y_pred = model.predict(X_test)
- print(“MSE:”, mean_squared_error(y_test, y_pred))
- 代码示例:
- 示例二 深度学习(TensorFlow/Keras 训练 MNIST)
- 代码示例:
- import tensorflow as tf
- from tensorflow.keras import Sequential
- from tensorflow.keras.layers import Dense, Flatten
- (x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()
- x_train, x_test = x_train/255.0, x_test/255.0
- model = Sequential([Flatten(input_shape=(28,28)), Dense(128, activation=‘relu’), Dense(10, activation=‘softmax’)])
- model.compile(optimizer=‘adam’, loss=‘sparse_categorical_crossentropy’, metrics=[‘accuracy’])
- model.fit(x_train, y_train, epochs=5, verbose=2)
- test_loss, test_acc = model.evaluate(x_test, y_test, verbose=0)
- print(f"Test accuracy: { test_acc:.4f} ")
- 代码示例:
- 运行方式:
- 脚本:python3 ml_project.py
- 交互式:jupyter notebook(浏览器中创建与运行 Notebook)
四 GPU 配置与常见问题
- GPU 前置检查与驱动建议:
- 确认驱动与工具链:nvidia-smi(应显示 CUDA 版本 与 GPU 型号)
- 深度学习环境优先使用 conda 安装对应 CUDA/cuDNN 的 PyTorch/TensorFlow 版本,减少兼容性问题
- 构建依赖缺失(编译类包如 NumPy/SciPy 等可能用到):
- 可安装:sudo apt install build-essential python3-dev gfortran libatlas-dev liblapack-dev
- 常见避坑:
- 避免混用 pip 与 conda 的包缓存;优先在各自环境内使用对应包管理器
- 桌面环境可选 Anaconda Navigator 管理环境与启动工具(如 Jupyter)
- 运行示例前确认已激活对应虚拟环境(命令行提示符应显示 (venv) 或 (ml_env))
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: Ubuntu Python机器学习应用
本文地址: https://pptw.com/jishu/755779.html
