千家信息网

学习笔记--hadoop

发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,Hadoophadoop-1.2.1.tar.gz jdk-6u32-linux-x64.binUseradd -u 900 hadoopMv jdk1.6.0_32 /home/hadoopMv h
千家信息网最后更新 2025年12月02日学习笔记--hadoop

Hadoop

hadoop-1.2.1.tar.gz jdk-6u32-linux-x64.bin

Useradd -u 900 hadoop

Mv jdk1.6.0_32 /home/hadoop

Mv hadoop-1.2.1.tar.gz/home/hadoop

Chown hadoop.hadoop /home/hadoop -R

Su -hadoop

Ln -s jdk1.6.0_32 java

Tar zxf hadoop-1.2.1.tar.gz hadoop-1.2.1

Ln -s hadoop-1.2.1 hadoop

更改环境变量:

Vim /hadoop/conf/hadoop-env.sh

Cd /hadoop

Mkdir input

Cp conf/*.xml input

Bin/hadoop jar hadoop-examples-1.2.1.jar grep input output 'dfs[a-z.]+'

设置无密码登陆:

Ssh-keygen

Ssh-copy-id 172.25.60.1

保证 master 到所有的 slave 节点都实现无密码登录

Cd ~/hadoop/conf

Vim slaves ---->172.25.60.1

Vim masters---->172.25.60.1

Vim core-site.xml configuration中间添加以下内容

fs.default.name

hdfs://172.25.60.1:9000

Vim hdfs-site.xml configuration中间添加以下内容

dfs.replication

1

Vim mapred-site.xml configuration中间添加以下内容

mapred.job.tracker

172.25.60.1:9001

格式化一个新的分布式文件系统:

$ bin/hadoop namenode -format

启动 Hadoop 守护进程:

$ bin/start-all.sh

在各个节点查看 hadoop 进程:

$ jps

Hadoop 守护进程的日志写入到 ${HADOOP_HOME}/logs 目录

浏览 NameNode JobTracker 的网络接口,它们的地址默认为:

NameNode - http://172.25.60.1:50070/

JobTracker - http://172.25.60.1:50030/

将输入文件拷贝到分布式文件系统:

$ bin/hadoop fs -put conf input

运行发行版提供的示例程序:

$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'

查看输出文件:

将输出文件从分布式文件系统拷贝到本地文件系统查看:

$ bin/hadoop fs -get output output

$ cat output/*

或者

在分布式文件系统上查看输出文件:

$ bin/hadoop fs -cat output/*

完成全部操作后,停止守护进程:

$ bin/stop-all.sh

完全分布式(三个节点)server1 server2 server4

在三个节点上安装 rpcbind nfs-utils 并打开rpcind nfs服务

Vim /etc/exports

/home/hadoop *(rw,all_squash,anonuid=900,anongid=900)

slave2 4上添加用户 useradd -u 900 hadoop

mount 172.25.60.1:/home/hadoop/ /home/hadoop/

1上分别进行ssh 连接 ssh 172.25.60.2ssh272.25.60.4

master上:vim ~/hadoop/conf

Vim slaves

172.25.60.2

172.25.60.4

Vim hdfs-site.xml

1 ------> 2

(删除tmp------>格式化---->bin/start-dfs.sh----->bin/hadoop fs -put conf/ input----->bin/start-mapred.sh

bin/hadoop jar hadoop-examples-1.2.1.jar grep input output 'dfs[a-z.]+')

bin/hadoop dfsadmin-report:查看节点运行状态

bin/hadoop fs -ls :查看输出文件

添加一个节点文件:

在线添加节点:

添加用户 useradd -u 900 hadoop

mount 172.25.60.1:/home/hadoop/home/hadoop

su - hadoop

vim slaves加入该节点 ----->>172.25.60.5

bin/hadoop-daemon.sh start datanode

bin/hadoop-daemon.sh start tasktracker

在线删除节点:

先做数据迁移:

server上:vim mapred-site.xml

dfs.hosts.exclude

/home/hadoop/hadoop/conf/hostexclude

Vim hadoop/hadoop/conf/hostexclude------->172.25.60.4

Bin/hadoop dfsadmin -refreshNodes ####刷新节点

回收站功能:

vimcore-site.xml添加以下:

fs.trash.interval

1440 1440=60*24

实验:bin/hadoop fs -rm input/hadoop-env.sh

bin/hadoop fs -ls input 查看是否删除

bin/hadoop fs -ls 此时新增目录 .Trash

bin/hadoop fs -ls .Trash/Current/user/hadoop/input

将此文件移回原目录即可恢复

bin/hadoop fs -mv .Trash/Current/user/hadoop/input/hadoop-env.sh input

优化:

更新hadoop2.6版本

删除之前的链接,解压hadoop-2.6.4.tar.gz jdk-7u79-linux-x64.tar.gzhadoop家目录,并更改权限为hadoop.hadoop进入hadoop用户,链接成hadoopjava,进入hadoop/etc/hadoop/

vim hadoop-env.sh export JAVA_HOME=/home/hadoop/java

cd /hadoop/etc/hadoop

vim core-site.xml

fs.defaultFS

hdfs://172.25.60.1:9000

vim hdfs-site.xml

dfs.replication

2

vim yarn-env.sh

# some Java parameters

export JAVA_HOME=/home/hadoop/java

cp mapred-site.xml.template mapred-site.xml

mapreduce.framework.name

yarn

vim yarn-site.xml

yarn.nodemanager.aux-services

mapreduce_shuffle

vim slaves

172.25.60.4

172.25.60.5

bin/hdfs namenode -format

sbin/start-dfs.sh

bin/hdfs dfs -mkdir /user

bin/hdfs dfs -mkdir /user/hadoop

bin/hdfs dfs -put etc/hadoop input

sbin/start-yarn.sh

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar grep input output 'dfs[a-z.]+'

访问 172.25.60.1:50070 172.25.60.1:8088

##########替换lib下文件为64(不更改的话启动时会有warn警告)

mv hadoop-native-64-2.6.0.tar /home/hadoop/hadoop/lib/native

tarxf hadoop-native-64-2.6.0.tar

###########指定节点目录


文件 节点 分布式 目录 系统 进程 输出 内容 用户 三个 密码 拷贝 格式 链接 在线 运行 功能 变量 回收站 地址 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 北京服务器虚拟化定制 吕梁网络技术参考价格 天美网络技术 与数据库领域相关的技术名称 软件开发论文基本结构 简述无线网络安全隐患 网上书店数据库技术 数据库怎么删除表单数据库 长沙乐视软件开发公司 点灯科技没有阿里云服务器 国泰安数据库字段说明书下载 ie浏览器的代理服务器在哪设置 数据库基本算术逻辑运算 发电厂内部网络安全管理系统 四川青少年网络安全大赛 我国网络安全国家重视程度 网络安全原理与实践马里克 日本的it软件开发工资多少钱 请各单位加强网络安全检查 网络安全网络监控意义 如何检查服务器硬盘健康状态 软件开发课程学习 网络安全宣传片制作 长沙计算机网络技术就业前景 点灯科技没有阿里云服务器 comcat部署数据库 2015 中国服务器市场 中国网络安全手抄报简单漂亮 山东网络安全测评机构 华为网络技术工程师细分部门
0