CentOS系统HBase如何监控
导读:监控目标与总体架构 覆盖组件:HBase 的 HMaster、多个 RegionServer、ZooKeeper 以及底层 HDFS/YARN(如部署在 YARN 上)。 数据来源:HBase 自带的 Web UI 与 Shell、JMX...
监控目标与总体架构
- 覆盖组件:HBase 的 HMaster、多个 RegionServer、ZooKeeper 以及底层 HDFS/YARN(如部署在 YARN 上)。
- 数据来源:HBase 自带的 Web UI 与 Shell、JMX 指标、Region 分布与负载、以及操作系统与网络层面指标。
- 可视化与告警:用 Prometheus + Grafana 做时序可视化与阈值告警,必要时结合 Ganglia/Nagios/Zabbix 做主机与服务可用性监控。
内置与命令行快速检查
- HBase Web UI:访问 http://:16010,查看集群健康、RegionServer 列表、表与 Region 分布、请求数/延迟等;RegionServer 页面常见端口为 16030。
- HBase Shell:
- 查看集群状态:
status(含 Master 状态、RegionServer 数量、ZooKeeper 连接等)。 - 一致性检查:
hbck(检查 Region、表、ZooKeeper 等的一致性与完整性)。
- 查看集群状态:
- 辅助定位:结合 HDFS NameNode UI 与 YARN ResourceManager UI 观察存储与资源分配是否异常。
JMX 指标与可视化告警
- JMX 暴露:HBase 通过 JMX 导出大量内部指标(请求率、延迟、MemStore/BlockCache、GC 等),可用 JConsole 或 HTTP 抓取。示例(Master JMX):
curl -X GET http://< master> :16010/jmx?qry=Hadoop:service=HBase,name=Master,sub=Server
- Prometheus 集成:部署 JMX Exporter,将 JMX 转为 /metrics,Prometheus 定期抓取并存入 TSDB。
- Grafana 可视化:导入 HBase 仪表盘(关注请求数、读写延迟、MemStore 使用、BlockCache 命中率、Region 数量与分布、GC 次数/时长等),配置阈值告警(如 P99 延迟、请求错误率、Region 长时间未上线等)。
- 其他可选:使用 Ganglia/Nagios/Zabbix 对 JMX 或 HTTP 端点做采集与可用性告警。
系统层面与健康巡检
- OS 与网络:用 top/htop、vmstat、free、iostat、netstat/ss、dstat、iftop 观察 CPU、内存、磁盘 IO、网络带宽与连接数,排查节点级瓶颈。
- 日志与轮转:HBase 使用 log4j 输出日志,建议按大小滚动并保留有限备份,便于问题定位与审计。
- 例行巡检:
- 集群:
status、hbck、表与 Region 分布是否均衡、是否有长时间 RIT(Region-in-Transition)。 - 存储:HDFS 容量与剩余空间、NameNode/DataNode 健康。
- 资源:YARN(如使用)队列与容器使用、抢占情况。
- 集群:
常见告警阈值与排障要点
- 关键阈值建议:
- MemStore 接近或超过 flush 阈值(如接近
hbase.hregion.memstore.flush.size),易触发频繁 flush/compaction,影响延迟。 - BlockCache 命中率下降,读放大上升。
- Region 长时间 RIT 或 RegionServer 频繁上下线。
- P95/P99 读写延迟突增或错误率升高。
- GC 次数/时长异常(伴随请求抖动)。
- MemStore 接近或超过 flush 阈值(如接近
- 快速排障路径:
- 先看 HMaster/RegionServer UI 与 JMX 指标定位异常维度(读/写/延迟/内存)。
- 查 Region 分布与负载是否均衡,必要时触发 balancer。
- 结合 日志 与 HDFS/YARN UI 判断底层资源与存储是否瓶颈。
- 若需深度排查,使用 hbck 检查一致性,并复核表/列族设计与 Region 数量。
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: CentOS系统HBase如何监控
本文地址: https://pptw.com/jishu/786121.html
