centos dolphin故障如何排查
导读:CentOS 上 Dolphin 故障排查指南 一 先确认组件类型 Dolphin 文件管理器:KDE Plasma 的默认文件管理器,常见于 CentOS 7/8/Stream 的 GNOME/KDE 桌面环境。若系统默认不是 KDE,...
CentOS 上 Dolphin 故障排查指南
一 先确认组件类型
- Dolphin 文件管理器:KDE Plasma 的默认文件管理器,常见于 CentOS 7/8/Stream 的 GNOME/KDE 桌面环境。若系统默认不是 KDE,需先安装 KDE 相关组件才可使用或排查其问题。
- Apache DolphinScheduler 调度平台:大数据工作流调度系统,常见端口 12345,依赖 JDK 1.8+、PostgreSQL 9.6+、Zookeeper 3.4.6+。
- DolphinDB 数据库:列式数据库,常见于 CentOS 7.9+ 场景。
- 快速判断:
- 执行
rpm -q dolphin或dnf provides */dolphin | grep -i file若命中 KDE 包,多为文件管理器。 - 执行
ss -ltnp | grep 12345或ps -ef | grep dolphinscheduler若命中,多为调度平台。 - 执行
ps -ef | grep dolphindb或查看是否有 dolphindb 相关服务单元。
以上组件在 CentOS 上的适配与依赖差异较大,定位方向完全不同,请先确认再按对应分支排查。
- 执行
二 Dolphin 文件管理器排查步骤
- 环境与健康检查
- 确认已安装 KDE 桌面:
sudo yum groupinstall "KDE Plasma Workspaces" -y(或安装kde-plasma-desktop)。 - 资源与磁盘:
df -h(根分区满会导致图形程序异常)、free -m、top。 - 系统日志:
/var/log/messages、/var/log/secure,以及会话日志~/.xsession-errors。
- 确认已安装 KDE 桌面:
- 启动与界面问题
- 终端前台启动:
dolphin,观察终端报错。 - 图形会话异常:切换到 X.Org(若默认是 Wayland):编辑
/etc/gdm/custom.conf,取消注释WaylandEnable=false,重启或重启 GDM:sudo systemctl restart gdm。
- 终端前台启动:
- 依赖与兼容性
- 更新系统与组件:
sudo yum update -y或sudo dnf update -y。 - 安装/补齐依赖:
sudo yum install -y qt5-qtbase-devel(按缺失提示补充 Qt5 相关库)。
- 更新系统与组件:
- 配置与权限
- 备份并重置配置:
mv ~/.config/dolphin{ ,.bak}、mv ~/.local/share/dolphin{ ,.bak},再重启 Dolphin 生成默认配置。 - 检查家目录与挂载点权限,避免因权限或 SELinux 策略导致访问异常。
- 备份并重置配置:
- 重装恢复
- 重装 Dolphin:
sudo yum remove dolphin -y & & sudo yum install dolphin -y;必要时重装 KDE 组件。
以上步骤覆盖了 Wayland/Xorg 切换、依赖缺失、配置损坏 等高频问题。
- 重装 Dolphin:
三 Apache DolphinScheduler 排查步骤
- 端口与进程
- 默认端口 12345:
ss -ltnp | grep 12345;进程:ps -ef | grep dolphinscheduler。 - 访问测试:
curl -I http://127.0.0.1:12345/dolphinscheduler或浏览器访问http://服务器IP:12345/dolphinscheduler。
- 默认端口 12345:
- 基础环境
- 确认 JDK 1.8+:
java -version;JAVA_HOME正确。
- 确认 JDK 1.8+:
- 外部依赖
- PostgreSQL:监听地址
listen_addresses='*',pg_hba.conf允许应用网段(如host all all 0.0.0.0/0 md5),服务已启动。 - Zookeeper:
/opt/zookeeper/bin/zkServer.sh status应返回 Mode: standalone/follower/leader。
- PostgreSQL:监听地址
- 配置核对
common.properties中数据库连接(spring.datasource.*)与注册中心(registry.servers=zk:2181)正确;若使用 HDFS 资源存储,核对resource.storage.type=HDFS、resource.hdfs.fs.defaultFS=...与 HDFS 权限。
- 初始化与启停
- 初始化数据库:
/opt/dolphinscheduler/script/create-dolphinscheduler.sh。 - 启停服务:
- API:
/opt/dolphinscheduler/bin/dolphinscheduler-daemon.sh start api-server - Master:
... start master-server - Worker:
... start worker-server - Alert:
... start alert-server
- API:
- 初始化数据库:
- 日志定位
- 查看各服务日志(如
api-server.log、master-server.log等)与dolphinscheduler.log,优先关注连接 数据库/Zookeeper 失败、HDFS 权限、端口占用等关键字。
以上流程覆盖 端口连通、依赖连通性、配置项 与 启停顺序 等关键点。
- 查看各服务日志(如
四 DolphinDB 排查步骤
- 环境核对
- 确认 CentOS 7.9+、
gcc 4.8.5+满足;检查端口(默认 8848 等)是否被占用:ss -ltnp | grep 8848。
- 确认 CentOS 7.9+、
- 依赖与冲突
- 若出现库冲突或安装失败,优先通过仓库或官方安装包解决依赖;必要时在测试环境验证后再处理生产环境。
- 日志与权限
- 查看安装与运行日志(安装目录
log/,或系统日志),并确认运行用户对安装目录与数据目录具备读写权限;如启用 SELinux,检查策略是否拦截。
- 查看安装与运行日志(安装目录
- 建议
- 生产环境优先采用容器化或隔离部署,减少依赖冲突与环境漂移。
以上要点聚焦 系统版本、依赖冲突 与 权限/SELinux 等常见根因。
- 生产环境优先采用容器化或隔离部署,减少依赖冲突与环境漂移。
五 通用快速定位清单
- 信息收集
- 系统状态:
uptime、top/htop、free -m、df -h。 - 内核与硬件:
dmesg | tail -n 100。 - 服务与端口:
systemctl status < service>、ss -ltnp、ps -ef | grep < 关键词>。 - 日志:
/var/log/messages、/var/log/secure、应用与服务日志。
- 系统状态:
- 恢复动作
- 重启相关服务或图形会话;回滚最近变更;必要时重装组件。
- 变更前建议
- 备份关键数据与配置(如 Dolphin 配置目录
~/.config/dolphin、~/.local/share/dolphin),并在操作前记录故障现象与处理过程,便于复盘。
以上为通用且高效的排障路径,可显著提升定位效率并降低风险。
- 备份关键数据与配置(如 Dolphin 配置目录
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: centos dolphin故障如何排查
本文地址: https://pptw.com/jishu/786002.html
