千家信息网

怎么搭建Hadoop运行环境

发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,这篇文章主要讲解了"怎么搭建Hadoop运行环境",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"怎么搭建Hadoop运行环境"吧!Hadoop 是一个分
千家信息网最后更新 2025年12月02日怎么搭建Hadoop运行环境

这篇文章主要讲解了"怎么搭建Hadoop运行环境",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"怎么搭建Hadoop运行环境"吧!

Hadoop 是一个分布式系统基础架构,在大数据领域被广泛的使用,它将大数据处理引擎尽可能的靠近存储,Hadoop 最核心的设计就是 HDFS 和 MapReduce,HDFS 为海量的数据提供了存储,MapReduce 为海量的数据提供了计算。

我们使用 Linux 操作系统来搭建环境,下面的信息是用来准备搭建 Hadoop 环境的电脑环境信息。

hadoop@ubuntu:~$ cat /etc/os-release NAME="Ubuntu" VERSION="14.04.5 LTS, Trusty Tahr" ID=ubuntu ID_LIKE=debian PRETTY_NAME="Ubuntu 14.04.5 LTS" VERSION_ID="14.04" HOME_URL="http://www.ubuntu.com/" SUPPORT_URL="http://help.ubuntu.com/" BUG_REPORT_URL="http://bugs.launchpad.net/ubuntu/"

紧接着来新建一个用户,这一步其实也可以省略的,可以根据实际情况来决定,这里是新建了一个叫 hadoop 的新用户。

#创建新用户 sudo useradd -m hadoop -s /bin/bash #设置密码 sudo passwd hadoop #为hadoop用户增加管理员权限 sudo adduser hadoop sudo #切换到hadoop用户 su hadoop

我们首先来设置一下 SSH 无密码登录,这一步建议都设置一下,因为分布式系统环境都是由多台服务器构成的,设置免密码登录会方便使用。

#先检查下是否可以在没有密码的情况下ssh到localhost ssh localhost #如果在没有密码的情况下无法ssh到localhost,请执行以下命令 ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys chmod 0600 ~/.ssh/authorized_keys

上面是一些准备工作,接下来就正式开始部署 Hadoop 环境了。我们先在 Apache 官网(http://hadoop.apache.org)这里下载最新的稳定版本的 Hadoop 发行版,然后解压到指定目录并进入这个目录,执行 ./bin/hadoop 和 ./bin/hadoop version 可以分别显示 hadoop 脚本的使用文档和版本信息,然后修改一下 ./etc/hadoop/core-site.xml 和 ./etc/hadoop/hdfs-site.xml这两个配置文件,配置修改分别如下所示。

修改 ./etc/hadoop/core-site.xml 配置文件,添加如下配置:

              fs.defaultFS         hdfs://localhost:9090                   hadoop.tmp.dir         file:/opt/bigdata/hadoop/tmp         A base for other temporary directories.      

修改 ./etc/hadoop/hdfs-site.xml 配置文件,添加如下配置:

              dfs.replication         1                   dfs.namenode.name.dir         file:/opt/bigdata/hadoop/tmp/dfs/name                   dfs.datanode.data.dir         file:/opt/bigdata/hadoop/tmp/dfs/data      

配置修改好之后,执行格式化文件系统,操作如下。

hadoop@ubuntu:/opt/bigdata/hadoop$ ./bin/hdfs namenode -format #执行后输出会比较多,看到下边这条信息表示成功  INFO common.Storage: Storage directory /opt/bigdata/hadoop/tmp/dfs/name has been successfully formatted.

在格式化 NameNode 的时候可能会遇到下面这样的两个问题。

  1. 提示 Error: JAVA_HOME is not set and could not be found. 的错误,这说明 JAVA_HOME 环境变量没有配置好,重新配置一下,或者修改 ./etc/hadoop/hadoop-env.sh 文件把 export JAVA_HOME=${JAVA_HOME} 直接修改成绝对目录 export JAVA_HOME=/usr/lib/jvm/java-8 既可解决。

  2. 提示 ERROR namenode.NameNode: java.io.IOException: Cannot create directory /opt/bigdata/hadoop/tmp/dfs/name/current 的错误,这是因为配置的 /opt/bigdata/hadoop/tmp 目录的写入权限有问题,可以直接执行 sudo chmod -R a+w /home/hadoop/tmp 即可解决。

接下来执行 ./sbin/start-dfs.sh 来开启 NameNode 和 DataNode 守护进程,然后检查 NameNode、DataNode 和 SecondaryNameNode 是否都已经启动成功,操作如下:

hadoop@ubuntu:/opt/bigdata/hadoop$ jps 4950 Jps 3622 SecondaryNameNode 3295 DataNode 2910 NameNode

启动成功之后可以用浏览器来打开 http://localhost:50070/ 浏览 NameNode 的Web界面。

到此为止,Hadoop 单节点集群(伪分布式)环境搭建就已经成功了, 接下来运行一个 Hadoop 伪分布式实例。因为 Hadoop 单机模式是运行的本地文件系统,(伪)分布式模式则是运行的 HDFS 上的数据。我们现在 HDFS 中创建用户目录,执行目命令 ./bin/hdfs dfs -mkdir -p /user/hadoop 即可,执行如下命令将输入文件复制到分布式文件系统中。

#这个可以不执行,因为会自动创建好目录的  #./bin/hdfs dfs -mkdir input ./bin/hdfs dfs -put etc/hadoop input #查看复制到HDFS的文件列表 ./bin/hdfs dfs -ls input

接下来运行一个 Hadoop 自带的 mapreduce 实例看看效果吧,直接执行如下命令。

./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples- 2.9.1.jar grep input output 'dfs[a-z.]+'

使用 ./bin/hdfs dfs -cat output/* 命令查看运行后在 HDFS 上的输出文件列表,或者使用下面的命令拷贝到本地查看。

./bin/hdfs dfs -get output output ./cat output/*

关闭 Hadoop 直接使用 ./sbin/stop-dfs.sh 命令即可。

感谢各位的阅读,以上就是"怎么搭建Hadoop运行环境"的内容了,经过本文的学习后,相信大家对怎么搭建Hadoop运行环境这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

环境 文件 配置 运行 命令 分布式 用户 目录 系统 密码 数据 成功 接下来 信息 情况 问题 学习 两个 内容 实例 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 皮卡堂服务器改名 华为麦芒4无法连接服务器网速慢 CSGO服务器正在连接 nebula开源分布式图数据库 阿里云服务器个人版快速入门 access指定数据库 打开电脑提示与服务器通信失败 合肥斑马网络技术有限公司 win10接入服务器名称 我的世界服务器空岛生存 三国演义笔记软件开发 燃烧的远征rp服务器 解放数据库 浙江服务器虚拟化多少钱 网络安全手势舞简单 sdl软件开发生命周期 科技互联网宣传主标语 万方数据库主题字段检索项 网络技术与应用实验教程 华为公司最新开发5g网络技术 多大年龄适合学习软件开发 网络安全竖着画的手抄报简单漂亮 怎么把路由器当成服务器 九九佳业网络技术 电话 重庆师范大学图书馆数据库资源 朝阳区信息化网络技术服务介绍 浙江通能软件开发有限公司 安徽云享云网络技术有限公司 汽车软件开发管理体系认证 金蝶旗舰版数据库和账套
0