ubuntu分卷如何监控
导读:Ubuntu 分卷监控实用指南 一 快速巡检与定位 容量与 inode:使用 df -hT 查看各分卷的总容量、已用/可用空间、使用率与文件系统类型;使用 df -i 检查是否发生 inode 耗尽(很多“磁盘满”其实是 inode 满)...
Ubuntu 分卷监控实用指南
一 快速巡检与定位
- 容量与 inode:使用 df -hT 查看各分卷的总容量、已用/可用空间、使用率与文件系统类型;使用 df -i 检查是否发生 inode 耗尽(很多“磁盘满”其实是 inode 满)。
- 目录占用定位:用 du -sh /path 汇总目录大小;用 ncdu /path 交互式找出大目录/大文件(需安装:sudo apt install ncdu)。
- 块设备与分区拓扑:用 lsblk -f 查看设备、分区、文件系统与挂载点关系;用 sudo fdisk -l 或 sudo parted -l 查看分区表;用 blkid 查看 UUID/文件系统类型。
- 硬件健康:对物理盘执行 sudo smartctl -a /dev/sda 查看 S.M.A.R.T. 健康信息(需安装 smartmontools)。
二 实时性能与瓶颈定位
- 安装性能工具集:sudo apt install sysstat iotop dstat。
- 设备级 I/O:用 iostat -x 1 观察关键指标——%util(设备利用率,接近 100% 表示磁盘饱和)、await(平均 I/O 响应时间)、r/s/w/s(每秒读写次数)、rkB/s/wkB/s(吞吐)。
- 系统级 I/O:用 vmstat 1 关注 wa(I/O 等待占比)、bi/bo(块设备读写)。
- 进程级 I/O:用 sudo iotop -o 仅显示正在做 I/O 的进程,并按 Shift+P 按 I/O 速率排序。
- 多盘对比与综合视图:用 dstat -d --disk-util 同时观察多块盘的利用率与吞吐。
三 LVM 专项监控
- 层级关系梳理:用 lsblk 确认 逻辑卷 → 卷组 → 物理卷 的映射与挂载点。
- 容量与剩余空间:用 vgdisplay 查看卷组总容量与剩余空间;用 pvdisplay 查看物理卷分配情况;用 lvdisplay 查看逻辑卷大小与属性。
- 性能关联分析:定位到具体 物理盘(如 /dev/sdX) 后用 iostat -x 1 观察 %util/await,避免只看挂载点而误判瓶颈位置。
四 自动化巡检与阈值告警
- 轻量脚本示例(按挂载点或设备路径,支持自定义阈值):
用法示例:chmod +x check_mount.sh & & ./check_mount.sh / 85 95。#!/usr/bin/env bash set -euo pipefail if [ $# -ne 3 ]; then echo "Usage: $0 < mount_point_or_device> < warn%> < crit%> " exit 3 fi mp="$1"; warn="$2"; crit="$3" used=$(df -P "$mp" | awk 'NR==2{ gsub(/%/,"",$5); print $5} ') if [ "$used" -ge "$crit" ]; then echo "CRITICAL: $mp usage ${ used} % (threshold ${ crit} %)" exit 2 elif [ "$used" -ge "$warn" ]; then echo "WARNING: $mp usage ${ used} % (threshold ${ warn} %)" exit 1 else echo "OK: $mp usage ${ used} %" exit 0 fi - 定时巡检与落盘:
- cron:每分钟记录一次 df
* * * * * root df -h > > /var/log/df.log 2> & 1 - systemd Timer(每 5 分钟执行一次):创建服务 disk-check.service 与定时器 disk-check.timer,启用:
sudo systemctl daemon-reload & & sudo systemctl enable --now disk-check.timer
- cron:每分钟记录一次 df
- 集中监控与可视化:
- 轻量实时:安装 Netdata(访问 http://服务器IP:19999)查看分卷 I/O 速率、空间使用 等。
- 传统平台:Zabbix/Nagios/Munin 配置分卷使用率阈值告警(如 > 80% 警告、> 90% 严重)。
五 常见排错要点
- 同时监控 容量与 inode(df -h 与 df -i),很多异常由 inode 耗尽引起。
- 分清 挂载点 与 物理盘:性能瓶颈常出现在承载该分卷的 物理盘,用 iostat -x 1 观察 %util/await 更准确。
- 目录增长定位优先用 ncdu,快速清理或制定扩容策略。
- 对生产盘定期做 S.M.A.R.T. 健康检查(smartctl -a),与容量/I-O 告警配合降低风险。
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: ubuntu分卷如何监控
本文地址: https://pptw.com/jishu/788782.html
