MapReduce将文本数据导入到HBase中
发表于:2025-11-07 作者:千家信息网编辑
千家信息网最后更新 2025年11月07日,整体描述:将本地文件的数据整理之后导入到hbase中在HBase中创建表数据格式MapReduce程序map程序package com.hadoop.mapreduce.test.map;import
千家信息网最后更新 2025年11月07日MapReduce将文本数据导入到HBase中
整体描述:将本地文件的数据整理之后导入到hbase中
在HBase中创建表
数据格式
MapReduce程序
map程序
package com.hadoop.mapreduce.test.map;import java.io.IOException;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;public class WordCountHBaseMapper extends Mapper
Reduce程序
package com.hadoop.mapreduce.test.reduce;import java.io.IOException;import java.util.Iterator;import org.apache.hadoop.hbase.client.Put;import org.apache.hadoop.hbase.mapreduce.TableReducer;import org.apache.hadoop.io.NullWritable;import org.apache.hadoop.io.Text;public class WordCountHBaseReduce extends TableReducer
{ @Override protected void reduce(Text key, Iterable value, Context out) throws IOException, InterruptedException { String keyValue = key.toString(); Iterator valueIterator = value.iterator(); while(valueIterator.hasNext()){ Text valueV = valueIterator.next(); String[] valueArray = valueV.toString().split("#"); Put putRow = new Put(keyValue.getBytes()); putRow.add("address".getBytes(), "baseAddress".getBytes(), valueArray[0].getBytes()); putRow.add("sex".getBytes(), "baseSex".getBytes(), valueArray[1].getBytes()); putRow.add("age".getBytes(), "baseAge".getBytes(), valueArray[2].getBytes()); out.write(NullWritable.get(), putRow); } }} 主程序
package com.hadoop.mapreduce.test;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Job;import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;import com.hadoop.mapreduce.test.map.WordCountHBaseMapper;import com.hadoop.mapreduce.test.reduce.WordCountHBaseReduce;/** * 将hdfs上的内容读取到,并插入到hbase的表中,然后读取hbase表中的内容,将统计结果插入到hbase中 */public class WordCountHBase { public static void main(String args[]) throws IOException, InterruptedException, ClassNotFoundException{ Configuration conf = HBaseConfiguration.create(); conf.set("hbase.zookeeper.quorum", "192.168.192.137"); Job job = Job.getInstance(conf, "MapReduceHbaseJob"); //各种class job.setJarByClass(WordCountHBase.class); job.setMapperClass(WordCountHBaseMapper.class); TableMapReduceUtil.initTableReducerJob("userInfo3", WordCountHBaseReduce.class, job); FileInputFormat.addInputPath(job, new Path(args[0])); job.setMapOutputKeyClass(Text.class); job.setMapOutputValueClass(Text.class); System.exit(job.waitForCompletion(true) ? 0 : 1); }}结果:

注:如果运行的client没有hbase,需要在hadoop里面的lib中加入hbase的lib
数据
程序
内容
结果
主程序
整体
文件
格式
类型
中创
中加
统计
运行
文本
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
幻塔初音未来数据库码
网络安全的主要侧重点
三一重工 软件开发
网络安全电影国产
国家宣传网络安全短片
网络安全数据管理条例征求意见稿
我的世界端游建房子服务器
PS4港服2k22连不上服务器
如何连接安全服务器地址
安徽精英网络技术服务哪家好
用什么软件开发ctp好
完善网络安全技术体系
jsp怎么传图片上传到服务器
距离网络安全审查10天
转数据库上钻下钻切片
国产服务器机箱价格
玉溪软件开发培训机构
惠普服务器关闭uefi启动
服务器电脑硬件升级
沈航图书馆外文数据库
无线网络摄像头连接服务器失败
java 连接数据库登录
网络安全用户认证可以指
ds920服务器经常消失
怀柔区通用软件开发指导
cs1.6服务器管理软件
保存股票数据到数据库
网页免费备案服务器
益阳数据库营销是什么
网站服务器慢