Python数据分析Ubuntu如何配置
导读:Ubuntu 下 Python 数据分析环境配置指南 一 基础环境准备 更新系统并安装 Python 3 与 pip: 命令:sudo apt update && sudo apt install -y python3...
Ubuntu 下 Python 数据分析环境配置指南
一 基础环境准备
- 更新系统并安装 Python 3 与 pip:
- 命令:
sudo apt update & & sudo apt install -y python3 python3-pip
- 命令:
- 建议使用虚拟环境隔离依赖:
- 创建:
python3 -m venv ~/venvs/data310 - 激活:
source ~/venvs/data310/bin/activate
- 创建:
- 升级 pip 并配置国内镜像(可选,提升下载速度):
- 命令:
pip install -U pip - 镜像示例:
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
- 命令:
- 验证:
python -V、pip -V应显示 Python 3.x 与对应 pip 版本。
二 安装常用数据分析库
- 在已激活的虚拟环境中,安装核心科学计算与可视化库:
- 命令:
pip install numpy pandas matplotlib seaborn scipy scikit-learn jupyter
- 命令:
- 按需扩展:
- 报表导出:
pip install reportlab - 机器学习/深度学习:如
pip install tensorflow(或pip install torch)
- 报表导出:
- 验证安装:
- 进入 Python:
python - < < 'PY' import sys, numpy, pandas, matplotlib, seaborn, scipy, sklearn, jupyter print("Python:", sys.version) print("NumPy:", numpy.__version__, "Pandas:", pandas.__version__) print("Matplotlib:", matplotlib.__version__, "Seaborn:", seaborn.__version__) print("SciPy:", scipy.__version__, "Scikit-learn:", sklearn.__version__) print("Jupyter:", jupyter.__version__) PY
- 进入 Python:
三 使用 Anaconda 的一体化方案(可选)
- 适合希望“开箱即用”管理环境与依赖的用户:
- 下载安装器:
wget https://repo.anaconda.com/archive/Anaconda3-2024.05-Linux-x86_64.sh - 执行安装:
bash Anaconda3-2024.05-Linux-x86_64.sh,按提示完成安装 - 使配置生效:
source ~/.bashrc - 创建并进入环境:
conda create -n data310 python=3.10 -y,conda activate data310 - 安装常用库:
conda install -c conda-forge numpy pandas matplotlib seaborn scipy scikit-learn jupyter - 图形化 IDE(可选):
conda install -c conda-forge spyder
- 下载安装器:
四 快速验证与常见操作
- 启动 Jupyter Notebook:
- 命令:
jupyter notebook - 浏览器访问:http://localhost:8888
- 命令:
- 读取数据与基础分析示例:
- 代码示例:
import pandas as pddf = pd.read_csv('data.csv')print(df.head())print(df.describe())df.plot(x='date', y='value', kind='line')import matplotlib.pyplot as plt; plt.show()
- 代码示例:
- 数据库读取示例(需安装对应驱动,如 PyMySQL):
- 安装:
pip install pymysql sqlalchemy - 代码示例:
from sqlalchemy import create_engineengine = create_engine('mysql+pymysql://user:password@host:3306/db')df = pd.read_sql('SELECT * FROM table_name', engine)
- 安装:
五 常见问题与优化建议
- 权限与系统 Python:优先使用 venv/conda 虚拟环境,避免对系统 Python 直接
sudo pip操作 - 镜像与缓存:配置 国内镜像源 并定期
pip cache purge,可显著加速安装 - 依赖冲突:不同项目使用独立环境;Anaconda 可用
conda env export > environment.yml共享环境 - 图形界面与远程:服务器无图形界面时,使用
--no-browser启动 Jupyter,配合 SSH 隧道端口转发 - 资源与性能:大数据集优先使用 dtype 优化、分块读取(
chunksize)、必要时考虑 Dask 或 Polars
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: Python数据分析Ubuntu如何配置
本文地址: https://pptw.com/jishu/751289.html
