千家信息网

Hadoop 集群部署

发表于:2025-12-04 作者:千家信息网编辑
千家信息网最后更新 2025年12月04日,1、修改所有主机的 机器名[root@hadoop1 ~]# vi /etc/networkshostname=hadoop12、做主机和IP映射 [root@hadoop1 ~]# vi /etc/
千家信息网最后更新 2025年12月04日Hadoop 集群部署

1、修改所有主机的 机器名
[root@hadoop1 ~]# vi /etc/networks

hostname=hadoop1

2、做主机和IP映射

 [root@hadoop1 ~]# vi /etc/hosts192.168.5.136 hadoop1192.168.5.137 hadoop3192.168.5.138 hadoop2

其中 一台修改后可以 拷贝
scp -r /etc/hosts root@hadoop1\2:/etc

3、SSH免登陆

[root@hadoop1 ~]# ssh-keygen -t rsa -P '' 在每台机器上执行一次;
将其他机器上的 /root/.ssh/下的所有文件删掉
[root@hadoop1 tmp]# scp -r /root/.ssh/id_rsa.pub root@hadoop2:/root/.ssh/authorized_keys 将hadoop1 公钥拷贝至所有服务器
[root@hadoop1 ~]# mv /root/.ssh/id_rsa.pub /root/.ssh/authorized_keys 最后修改本地 公钥文件即可。

最后验证 [root@hadoop1 ~]# ssh hadoop2

           [root@hadoop1 ~]# ssh hadoop3

4、关闭防火墙-所有服务器全部执行
[root@hadoop1 ~]# systemctl stop firewalld.service
[root@hadoop1 ~]# systemctl disable firewalld.service

5、时间同步


二、Hadoop 环境搭建
1、 JAVA配置
[root@hadoop1 software]# tar -zxvf jdk-8u171-linux-x64.tar.gz 解压
[root@hadoop1 software]# mv jdk1.8.0_171/ /usr/java 移至指定目录

#配置环境变量 [root@hadoop1 sbin]# vi /etc/profile
export JAVA_HOME=/tmp/jdk1.8.0_171
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$JAVA_HOME/bin:$PATH

最后将 java 拷贝至其他机器以及修改 环境变量
scp -r /usr/java/ root@hadoop2:/usr/
scp -r /usr/java/ root@hadoop3:/usr/
修改环境变量
[root@hadoop3 usr]# vi /etc/profile
[root@hadoop3 usr]# source /etc/profile 生效


2、hadoop 配置编译安装
在其中一台服务器上面配置然后同步至其他机器即可

[root@hadoop1 software]# tar -zxvf hadoop-2.7.7.tar.gz 解压 Hadoop
[root@hadoop1 software]# cd hadoop-2.7.7 登陆 hadoop 目录

配置环境变量
[root@hadoop1 hadoop-2.7.7]# vi /etc/profile
export JAVA_HOME=/usr/java
export HADOOP_HOME=/opt/software/hadoop-2.7.7
export PATH=$HADOOP_HOME/bin:$FINDBUGS_HOME/bin:$PROTOC_HOME/bin:$MAVEN_HOME/bin:$JAVA_HOME/bin:$PATH

 [root@hadoop1 hadoop-2.7.7]# source /etc/profile  生效

3、修改配置文件
[root@hadoop1 hadoop]# cd /opt/hadoop/etc/hadoop/ 切换此文件目录 设置配置文件
其中 主要修改 core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml
修改 core-site 配置文件
vi core-site.xml




fs.defaultFS
hdfs://hadoop1:8020


hadoop.tmp.dir
/opt/software/hadoop-2.7.7/data/tmp


修改 hdfs-site.xml 配置文件



dfs.namenode.secondary.http-address
hadoop3:50090


修改 mapred-site.xml 配置文件
[root@hadoop1 hadoop]# cp mapred-site.xml.template mapred-site.xml
[root@hadoop1 hadoop]# vi mapred-site.xml 编辑配置文件




mapreduce.framework.name
yarn


mapreduce.jobhistory.address
hadoop1:10020


mapreduce.jobhistory.webapp.address
hadoop1:19888


修改 yarn-site.xml 配置文件




yarn.nodemanager.aux-services
mapreduce_shuffle


yarn.resourcemanager.hostname
hadoop2


yarn.log-aggregation-enable
true


yarn.log-aggregation.retain-seconds
106800


修改 slaves 文件
[root@hadoop1 hadoop]# vi slaves
hadoop1
hadoop2
hadoop3

在一台机器上(最好是hadoop1)做完这些配置之后,我们使用scp命令将这些配置传输到其他机器上
输入:

hadoop环境传输
[root@hadoop1 hadoop]# scp -r /opt/hadoop/ root@hadoop2:/opt/
[root@hadoop1 hadoop]# scp -r /opt/hadoop/ root@hadoop3:/opt/

配置其他节点 环境变量

[root@hadoop2 software]# vi /etc/profile
export JAVA_HOME=/usr/java
export HADOOP_HOME=/opt/software/hadoop-2.7.7

export PATH=$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH

[root@hadoop2 software]# source /etc/profile 刷新生效

-----传输之后,便在主节点启动集群。 在启动hadoop之前,需要初始化,这个只需要在hadoop1上初始化就可以了

4、启动hadoop
--在NameNode机器上执行格式化:
[root@hadoop1 hadoop]# /opt/software/hadoop-2.7.7/bin/hdfs namenode -format 格式化命令
注意:
如果要重新格式化 需要将 hadoop1 namenode datanode 文件目录下的 /opt/software/hadoop-2.7.7/data/tmp/dfs/name/current/ 目录下的集群ID清理掉,不然重新
做格式化会生成一个新的 ID这样 就与 datanode集群ID不一致;

5、启动 HDFS
[root@hadoop1 hadoop]# /opt/software/hadoop-2.7.7/sbin/start-dfs.sh

6、启动YARN
[root@hadoop1 hadoop]# /opt/software/hadoop-2.7.7/sbin/start-yarn.sh

7、在hadoop2 上启动 ResourceManager
[root@hadoop2 software]# /opt/software/hadoop-2.7.7/sbin/yarn-daemon.sh start resourcemanager

8、在hadoop3 上启动 日志服务器

[root@hadoop3 ~]# /opt/software/hadoop-2.7.7/sbin/mr-jobhistory-daemon.sh start historyserver

9、查看 YARN WEB 页面
http://192.168.5.138:8088/cluster

10、打开 HDFS WEB 页面

http://192.168.5.136:50070/

部署完毕,即可学习 hadoop

配置 文件 机器 环境 变量 目录 服务器 格式 服务 集群 拷贝 传输 主机 公钥 命令 节点 页面 同步 登陆 一致 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 数据库对软件开发的重要性 如何给服务器配公网ip 数据库表什么可空什么不可空 银行系统数据库设计 刺激战场吃鸡服务器设置 家庭教育与网络安全专题讲座 django数据库实时删 qq邮箱服务器域名 镇江大规模分布式存储数据库 数据库事务4种解决办法 服务器内存可以当普通内存用吗 西安嵌入式软件开发工资多少 工控嵌入式软件开发 社区生鲜线上软件开发 数据库审计绿型号 服务器监控哪家好厂商 学不会数据库的表情包 互联网金融是否属于金融科技 虹口区会计软件开发口碑推荐 数据库系统概论怎么考试 上海网络技术学院地址 墨行者互联网科技有限公司 华为交换机acl限制访问服务器 网络技术有限公司企业文化 tcp简单服务器的实现 梅特卡夫定律网络技术发展规律 怎么使用腾讯云服务器挂网页 关闭网络安全监测 DNA基因数据库比对证明 进入网站显示服务器错误
0