大数据平台CDH搭建
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,一、概述Cloudera版本(Cloudera's Distribution Including Apache Hadoop,简称"CDH"),基于Web的用户界面,支持大多数Hadoop组件,包括H
千家信息网最后更新 2025年12月03日大数据平台CDH搭建
一、概述
Cloudera版本(Cloudera's Distribution Including Apache Hadoop,简称"CDH"),基于Web的用户界面,支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop,简化了大数据平台的安装、使用难度。
二、安装部署
| 序号 | IP地址 | 主机名 | 系统版本 |
|---|---|---|---|
| 1 | 172.20.2.222 | cm-server | centos7.3 |
| 2 | 172.20.2.203 | hadoop-1 | centos7.3 |
| 3 | 172.20.2.204 | hadoop-2 | centos7.3 |
| 4 | 172.20.2.205 | hadoop-3 | centos7.3 |
2.2.1 基础环境部署
a.修改主机名配置hosts
systemctl stop firewalldhostnamectl set-hostname cm-server #更改个主机名sed -i 's/SELINUX=enforcing/SELINUX=disable/g' /etc/selinux/configsetenforce 0cat >>/etc/hosts<b.配置cm-server免密钥登录其他节点
ssh-keygen -t rsa #在cm-server生成密钥对for num in `seq 1 3`;do ssh-copy-id -i /root/.ssh/id_rsa.pub root@hadoop-$num;donec.在cm-server安装数据库
在cm-server上安装mariadb,用于后期数据存储
yum install mariadb*systemctl start mariadbmysql -uroot password "mysqladmin"登录数据库后我们采用root登录e.java环境配置
如果系统有安装java环境卸载干净使用oracle的jdk,此处使用jdk-7u80-linux-x64.rpm,在各节点均配置java环境
rpm -ivh jdk-7u80-linux-x64.rpmcat >/etc/profile.d/java.sh<f.配置各节点服务器需求
sysctl -w vm.swappiness=10echo "vm.swappiness=10" >>/etc/sysctl.confecho never > /sys/kernel/mm/transparent_hugepage/defragecho never > /sys/kernel/mm/transparent_hugepage/enabled2.2.2 Cloudera Manager安装
a.下载解压相关软件包
mkdir /software && cd /softwarewget -c https://archive.cloudera.com/cm5/cm/5/cloudera-manager-centos7-cm5.14.1_x86_64.tar.gz wget -c http://archive.cloudera.com/cdh6/parcels/5.14.2/CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcelwget -c http://archive.cloudera.com/cdh6/parcels/5.14.2/CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel.sha1 -O CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel.shawget -c http://archive.cloudera.com/cdh6/parcels/5.14.2/manifest.jsonwget -c https://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.46.ziptar -zxvf cloudera-manager-centos7-cm5.14.1_x86_64.tar.gz -C /opt/ #解压cm包unzip mysql-connector-java-5.1.46.zip #解压java-mysql连接jar包cp mysql-connector-java-5.1.46/mysql-connector-java-5.1.46-bin.jar /opt/cm-5.14.1/share/cmf/lib/ #将jar包复制到cm的lib目录下cp mysql-connector-java-5.1.46/mysql-connector-java-5.1.46-bin.jar b.创建用户及初始化数据库
useradd --system --home=/opt/cm-5.14.1/run/cloudera-scm-server/ --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm #在各个节点均创建用户vim /opt/cm-5.14.1/etc/cloudera-scm-agent/config.ini将其中的server_host=cm-server #指向cm-serverusage: /opt/cm-5.14.1/share/cmf/schema/scm_prepare_database.sh [options] (postgresql|mysql|oracle) database username [password] #使用选项/opt/cm-5.14.1/share/cmf/schema/scm_prepare_database.sh mysql cmdb -h"cm-server" -uroot -pmysqladmin --scm-host cm-server scm scm scmc.将文件将cm-server修改完成的文件分发到其他各节点
for i in `seq 1 3`;do scp -r /opt/cm-5.14.1 hadoop-$i:/opt/;doned.创建本地源
mv CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel* manifest.json /opt/cloudera/parcel-repo/e.启动服务
在cm-server启动server和agent服务,在其他节点启动agent服务
/opt/cm-5.14.1/etc/init.d/cloudera-scm-server start/opt/cm-5.14.1/etc/init.d/cloudera-scm-agent start2.2.2 Cloudera Manager的web界面配置
服务器均启动后,可以浏览器访问cm-server的7180端口,用户名/密码为admin/admin
接受协议继续
可以选择适用60天
提示一些涉及许可证的信息
勾选管理的主机继续操作
选择CDH-5.14版本
parcel安装
主机正确性检查
群集设置(选择安装的服务)
自定义角色分配,选择安装在那个节点上
数据库设置
需要提前创建数据库及授权其他节点可以正常连接
审核更改
集群安装
完成安装
后期可添加服务
节点
数据
服务
配置
主机
数据库
环境
用户
选择
版本
登录
密钥
文件
服务器
界面
系统
a.
平台
干净
信息
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
魔兽世界新服务器下载
单位网络安全做了哪些部署
网络安全防御技能判断题
网络安全问题的总结
腾讯云服务器并发连接限制
服务器机柜哪个品牌好
2008收缩数据库脚本
学生与网络安全
网络安全检查自查工作部署情况
戴尔服务器在北京的经销商是哪个
查询服务器信息
广西职校网络技术
软件开发岗工资高吗
数据库有两个外键命令怎么写
台式电脑当服务器配置
珠海安卓软件开发有用吗
数据库安装运行库
电脑云服务器连接
云服务器密码机技术
数据库是本地的还是云端的
什么对服务器要求最高
双非二本软件开发找工作
软件开发的前端
数据库中查询所有列是
小型财务软件开发工具
丰富人像比对数据库
金山软件开发转正概率
白城可信的计算机网络技术
台达服务器机柜
学校当前网络安全存在的突出问题