eclipse上搭建hadoop开发环境
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,一、概述1.实验使用的Hadoop集群为伪分布式模式,eclipse相关配置已完成;2.软件版本为hadoop-2.7.3.tar.gz、apache-maven-3.5.0.rar。二、使用ecli
千家信息网最后更新 2025年12月03日eclipse上搭建hadoop开发环境
一、概述
1.实验使用的Hadoop集群为伪分布式模式,eclipse相关配置已完成;
2.软件版本为hadoop-2.7.3.tar.gz、apache-maven-3.5.0.rar。
二、使用eclipse连接hadoop集群进行开发
1.在开发主机上配置hadoop
①将hadoop-2.7.3.tar.gz解压到本地主机上

②使用windows版本的hadoop中的bin替换目标中的bin文件夹

③配置windows上的hadoop环境变量
2.在eclipse上配置hadoop集群信息
①在eclipse中添加hadoop路径
②配置hadoop集群访问信息
3.在hadoop集群中取消权限验证
hdfs-site.xmldfs.permissions false
4.创建一个文件测试连接权限
5.安装maven
①将maven解压到开发主机上
②在eclipse上添加maven路径
5.新建maven工程
6.修改maven配置文件(maven/pom.xml)
org.apache.hadoop hadoop-client 2.7.3 junit junit 3.8.1 test
7.新建一个类用于测试(WordCount)
import java.io.IOException;import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Job;import org.apache.hadoop.mapreduce.Mapper;import org.apache.hadoop.mapreduce.Reducer;import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;import org.apache.hadoop.util.GenericOptionsParser; public class WordCount { public static class TokenizerMapper extends Mapper8.配置WordCount
①将log4j.properties移动到WordCount类下
②设置WordCount的运行自变量
8.运行测试
三、jar包的导出与提交执行
1.导出WordCount
2.将导出的jar包上传到hadoop集群
[hadoop@hadoop ~]$ lswc.jar
3.运行
[hadoop@hadoop ~]$ hadoop jar wc.jar WordCount /user/hadoop/input/* /user/hadoop/output/out17/09/06 22:36:56 INFO client.RMProxy: Connecting to ResourceManager at hadoop/192.168.100.141:803217/09/06 22:36:57 INFO input.FileInputFormat: Total input paths to process : 117/09/06 22:36:58 INFO mapreduce.JobSubmitter: number of splits:117/09/06 22:36:58 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1504744740212_000117/09/06 22:36:59 INFO impl.YarnClientImpl: Submitted application application_1504744740212_000117/09/06 22:36:59 INFO mapreduce.Job: The url to track the job: http://hadoop:8088/proxy/application_1504744740212_0001/17/09/06 22:36:59 INFO mapreduce.Job: Running job: job_1504744740212_000117/09/06 22:37:36 INFO mapreduce.Job: Job job_1504744740212_0001 running in uber mode : false17/09/06 22:37:36 INFO mapreduce.Job: map 0% reduce 0/09/06 22:38:26 INFO mapreduce.Job: map 100% reduce 0/09/06 22:38:42 INFO mapreduce.Job: map 100% reduce 100/09/06 22:38:46 INFO mapreduce.Job: Job job_1504744740212_0001 completed successfully
4.查看运行结果
[hadoop@hadoop ~]$ hdfs dfs -cat /user/hadoop/output/out/part-r-00000"AS 1"GCC 1"License"); 1& 1'Aalto 1'Apache 4'ArrayDeque', 1'Bouncy 1'Caliper', 1'Compress-LZF', 1……
配置
集群
运行
开发
文件
测试
主机
信息
权限
版本
路径
环境
分布式
变量
工程
文件夹
模式
目标
结果
自变量
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
qq程序软件开发
局网络安全培训计划
广州幸福网络技术
dns重定向服务器
安徽机械软件开发生产厂家
一年级网络安全宣传卡片
广州税筹软件开发
能源统计年鉴数据库官网
软件开发不会被辞退
最新的软件开发模型
数据库datetime类型
曙光服务器产地
excel数据插入数据库
f5服务器地址映射
vivox50的网络安全密钥
深圳星诚软件开发
社交网络安全例子
漳平软件开发外包公司哪家好
软件开发涉及的国家标准
浙江加工刀片服务器价格
至强处理器有必要用服务器主板吗
怎么访问etcd数据库
网络安全周ctf大赛
车联网 网络安全公司
方舟为什么进不去多人服务器
网络技术兴起
网络安全实战应急演练
mysql数据库表名称前缀
海康威视软件开发一般有几面
全国信息技术人才数据库官网