首页主机资讯CentOS上HDFS安装步骤是什么

CentOS上HDFS安装步骤是什么

时间2025-12-02 13:01:03发布访客分类主机资讯浏览286
导读:CentOS 上安装与部署 HDFS 步骤 一 准备环境 操作系统建议使用 CentOS 7/8,确保节点间网络互通,配置 /etc/hosts 或使用 DNS 正确解析主机名。 安装 Java 8(Hadoop 3.x 常用版本): s...

CentOS 上安装与部署 HDFS 步骤

一 准备环境

  • 操作系统建议使用 CentOS 7/8,确保节点间网络互通,配置 /etc/hosts 或使用 DNS 正确解析主机名。
  • 安装 Java 8(Hadoop 3.x 常用版本):
    sudo yum install -y java-1.8.0-openjdk-devel
    java -version
  • 配置 SSH 免密登录(集群管理需要):
    ssh-keygen -t rsa
    ssh-copy-id hadoop@namenode
    ssh-copy-id hadoop@datanode1
  • 防火墙放行端口(示例):9000(HDFS RPC)、50070(NameNode Web UI)、以及 DataNode 常用端口 50010/50020/50075/50090;如使用 YARN,还需 8088(ResourceManager Web UI)。

二 安装 Hadoop 并配置环境变量

  • 下载并解压(以 Hadoop 3.3.1 为例):
    wget https://archive.apache.org/dist/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
    tar -xzvf hadoop-3.3.1.tar.gz -C /usr/local/
    sudo mv /usr/local/hadoop-3.3.1 /usr/local/hadoop
  • 配置环境变量(/etc/profile.d/hadoop.sh):
    export HADOOP_HOME=/usr/local/hadoop
    export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
    source /etc/profile.d/hadoop.sh
  • 验证安装:
    hadoop version

三 配置 HDFS 核心文件

  • 编辑 $HADOOP_HOME/etc/hadoop/hadoop-env.sh
    export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
  • 编辑 core-site.xml
    fs.defaultFS hdfs://namenode:9000 hadoop.tmp.dir /usr/local/hadoop/tmp
  • 编辑 hdfs-site.xml
    dfs.replication 3 dfs.namenode.name.dir /usr/local/hadoop/data/namenode dfs.datanode.data.dir /usr/local/hadoop/data/datanode
  • 集群节点清单(workers/slaves):在 $HADOOP_HOME/etc/hadoop/workers(旧版为 slaves)中列出所有 DataNode 主机名,例如:
    datanode1
    datanode2
    datanode3

四 启动与验证

  • 首次启动前在 NameNode 上格式化:
    hdfs namenode -format
  • 启动 HDFS:
    start-dfs.sh
  • 验证进程(应见到 NameNode/DataNode/SecondaryNameNode 等):
    jps
  • 查看 HDFS 状态与 Web UI:
    hdfs dfsadmin -report
    浏览器访问 http://namenode:50070(NameNode Web UI)。

五 常见问题与扩展

  • 目录权限与归属:确保 Hadoop 目录可被运行用户访问,例如:
    sudo chown -R hadoop:hadoop /usr/local/hadoop
  • 时间同步:集群节点建议启用 NTP 同步,避免安全令牌过期等问题。
  • 单节点快速部署:如仅测试,可将 fs.defaultFS 设为 hdfs://localhost:9000,并将 dfs.replication 设为 1
  • 启用 YARN(可选):配置 mapred-site.xmlmapreduce.framework.name=yarn,配置 yarn-site.xmlyarn.nodemanager.aux-services=mapreduce_shuffle,然后启动 start-yarn.sh,访问 http://resourcemanager:8088

声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!


若转载请注明出处: CentOS上HDFS安装步骤是什么
本文地址: https://pptw.com/jishu/761184.html
HDFS在CentOS中的性能如何 CentOS HDFS性能瓶颈怎么解决

游客 回复需填写必要信息