首页主机资讯Python数据分析Ubuntu如何配置

Python数据分析Ubuntu如何配置

时间2025-11-19 16:22:04发布访客分类主机资讯浏览327
导读:Ubuntu 下 Python 数据分析环境配置指南 一 基础环境准备 更新系统并安装 Python 3 与 pip: 命令:sudo apt update && sudo apt install -y python3...

Ubuntu 下 Python 数据分析环境配置指南

一 基础环境准备

  • 更新系统并安装 Python 3pip
    • 命令:sudo apt update & & sudo apt install -y python3 python3-pip
  • 建议使用虚拟环境隔离依赖:
    • 创建:python3 -m venv ~/venvs/data310
    • 激活:source ~/venvs/data310/bin/activate
  • 升级 pip 并配置国内镜像(可选,提升下载速度):
    • 命令:pip install -U pip
    • 镜像示例:pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
  • 验证:python -Vpip -V 应显示 Python 3.x 与对应 pip 版本。

二 安装常用数据分析库

  • 在已激活的虚拟环境中,安装核心科学计算与可视化库:
    • 命令:pip install numpy pandas matplotlib seaborn scipy scikit-learn jupyter
  • 按需扩展:
    • 报表导出:pip install reportlab
    • 机器学习/深度学习:如 pip install tensorflow(或 pip install torch
  • 验证安装:
    • 进入 Python:python - < < 'PY' import sys, numpy, pandas, matplotlib, seaborn, scipy, sklearn, jupyter print("Python:", sys.version) print("NumPy:", numpy.__version__, "Pandas:", pandas.__version__) print("Matplotlib:", matplotlib.__version__, "Seaborn:", seaborn.__version__) print("SciPy:", scipy.__version__, "Scikit-learn:", sklearn.__version__) print("Jupyter:", jupyter.__version__) PY

三 使用 Anaconda 的一体化方案(可选)

  • 适合希望“开箱即用”管理环境与依赖的用户:
    • 下载安装器:wget https://repo.anaconda.com/archive/Anaconda3-2024.05-Linux-x86_64.sh
    • 执行安装:bash Anaconda3-2024.05-Linux-x86_64.sh,按提示完成安装
    • 使配置生效:source ~/.bashrc
    • 创建并进入环境:conda create -n data310 python=3.10 -yconda activate data310
    • 安装常用库:conda install -c conda-forge numpy pandas matplotlib seaborn scipy scikit-learn jupyter
    • 图形化 IDE(可选):conda install -c conda-forge spyder

四 快速验证与常见操作

  • 启动 Jupyter Notebook
    • 命令:jupyter notebook
    • 浏览器访问:http://localhost:8888
  • 读取数据与基础分析示例:
    • 代码示例:
      • import pandas as pd
      • df = pd.read_csv('data.csv')
      • print(df.head())
      • print(df.describe())
      • df.plot(x='date', y='value', kind='line')
      • import matplotlib.pyplot as plt; plt.show()
  • 数据库读取示例(需安装对应驱动,如 PyMySQL):
    • 安装:pip install pymysql sqlalchemy
    • 代码示例:
      • from sqlalchemy import create_engine
      • engine = create_engine('mysql+pymysql://user:password@host:3306/db')
      • df = pd.read_sql('SELECT * FROM table_name', engine)

五 常见问题与优化建议

  • 权限与系统 Python:优先使用 venv/conda 虚拟环境,避免对系统 Python 直接 sudo pip 操作
  • 镜像与缓存:配置 国内镜像源 并定期 pip cache purge,可显著加速安装
  • 依赖冲突:不同项目使用独立环境;Anaconda 可用 conda env export > environment.yml 共享环境
  • 图形界面与远程:服务器无图形界面时,使用 --no-browser 启动 Jupyter,配合 SSH 隧道端口转发
  • 资源与性能:大数据集优先使用 dtype 优化、分块读取(chunksize)、必要时考虑 DaskPolars

声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!


若转载请注明出处: Python数据分析Ubuntu如何配置
本文地址: https://pptw.com/jishu/751289.html
如何在Ubuntu中监控Python应用 如何在Ubuntu中集成Python工具

游客 回复需填写必要信息