ubuntu环境如何进行系统监控
导读:Ubuntu 系统监控实用指南 一 快速上手 命令行与桌面工具 实时进程与资源 top:查看整体与进程资源占用 htop(需安装):sudo apt install htop,界面更友好、支持按键筛选与树状视图 ps:ps aux 查看...
Ubuntu 系统监控实用指南
一 快速上手 命令行与桌面工具
- 实时进程与资源
- top:查看整体与进程资源占用
- htop(需安装):sudo apt install htop,界面更友好、支持按键筛选与树状视图
- ps:ps aux 查看进程快照
- 内存与交换
- free -h:以人类可读单位显示内存与交换使用情况
- 综合与 I/O
- vmstat [interval]:CPU、内存、进程与 I/O 概览
- iostat(需安装 sysstat):sudo apt install sysstat;iostat -c 仅看 CPU;iostat 查看磁盘 I/O
- iotop(需安装):按进程查看磁盘读写
- 桌面图形化
- GNOME System Monitor(系统监控):搜索并打开即可查看 CPU、内存、磁盘、网络与进程
二 进阶与远程 一体化与 Web 可视化
- Glances(跨平台一体化监控)
- 安装:sudo apt install glances
- 常用:glances 进入监控;glances -e 启用传感器(温度等)
- 远程:在服务端 glances -s -B 0.0.0.0 -p 61209,客户端 glances -c @server(可加 -P 设置访问密码)
- Netdata(实时可视化)
- 一键安装与启动(脚本方式),访问 http://< 服务器IP> :19999 查看仪表盘
- Web 平台方案
- Prometheus + Grafana:Prometheus 负责采集时序数据,Grafana 负责可视化与告警面板(适合多主机与长期观测)
- 其他可选:Monitorix(轻量 Web 监控)、Cacti/Observium(基于 SNMP 的网络与设备监控)
三 服务与告警 进程守护与阈值报警
- systemd 服务自恢复
- 创建服务单元(示例):/etc/systemd/system/my-service.service
- [Unit] Description=My Service;After=network.target
- [Service] ExecStart=/path/to/app;Restart=always;User=your_user
- [Install] WantedBy=multi-user.target
- 启用与查看:sudo systemctl enable --now my-service;sudo systemctl status my-service
- 创建服务单元(示例):/etc/systemd/system/my-service.service
- Monit(进程与资源阈值告警)
- 安装:sudo apt install monit
- 配置示例(/etc/monit/conf.d/my-service.conf):
- check process my-service with pidfile /var/run/my-service.pid
- start program = “/etc/init.d/my-service start”
- stop program = “/etc/init.d/my-service stop”
- if memory > 200 MB for 5 cycles then alert your_email@example.com
- 启动:sudo systemctl start monit
- 传统平台
- Nagios/Zabbix:适合大规模与复杂环境的监控与告警编排
四 历史与趋势 收集、可视化与排障
- 启用 sysstat 收集历史性能数据
- 安装:sudo apt install sysstat
- 配置:编辑 /etc/default/sysstat,将 ENABLED=“false” 改为 ENABLED=“true”
- 重启服务:sudo systemctl restart sysstat
- 使用:sar -u 查看 CPU 历史;sar -r 内存;sar -b I/O;配合 iostat/vmstat 做对比分析
- 排障常用命令组合
- 负载与进程:top/htop;ps aux | grep < 关键词>
- 内存:free -h;vmstat 1 5
- 磁盘 I/O:iostat -x 1;iotop
- 网络:ss -tulpen | head(按需替换为你常用的网络工具)
五 安全与维护 远程访问与最佳实践
- Glances 远程访问
- 仅在内网或受控网络开放;使用强密码(glances -s -P < 密码> ),或配合防火墙限制来源 IP
- 最小暴露面
- Web 类监控(如 Netdata、Grafana)建议绑定 127.0.0.1 并通过反向代理与鉴权访问;必要时启用 TLS
- 资源与日志
- 设置数据保留策略(如 Prometheus 的 retention.time),避免磁盘被历史数据撑满
- 为告警配置合适的阈值与收敛策略,避免告警风暴
- 定期巡检
- 建立巡检清单:CPU/内存/磁盘使用率、I/O 等待、服务存活、证书与内核日志(journalctl)
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: ubuntu环境如何进行系统监控
本文地址: https://pptw.com/jishu/750727.html
