MapReduce之Job工具类开发
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,[toc]MapReduce之Job工具类开发在MapReduce程序写Mapper和Reducer的驱动程序时,有很多代码都是重复性代码,因此可以将其提取出来写成一个工具类,后面再写MapReduc
千家信息网最后更新 2025年12月02日MapReduce之Job工具类开发
[toc]
MapReduce之Job工具类开发
在MapReduce程序写Mapper和Reducer的驱动程序时,有很多代码都是重复性代码,因此可以将其提取出来写成一个工具类,后面再写MapReduce程序时都会使用这个工具类。
Job工具类开发
程序代码如下:
package com.uplooking.bigdata.common.utils;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.mapreduce.*;import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;import java.io.IOException;public class MapReduceJobUtil { public static Job buildJob(Configuration conf, Class> jobClazz, String inputpath, Class extends InputFormat> inputFormat, Class extends Mapper> mapperClass, Class> mapKeyClass, Class> mapValueClass, Path outputpath, Class extends OutputFormat> outputFormat, Class extends Reducer> reducerClass, Class> outkeyClass, Class> outvalueClass) throws IOException { String jobName = jobClazz.getSimpleName(); Job job = Job.getInstance(conf, jobName); //设置job运行的jar job.setJarByClass(jobClazz); //设置整个程序的输入 FileInputFormat.setInputPaths(job, inputpath); job.setInputFormatClass(inputFormat);//就是设置如何将输入文件解析成一行一行内容的解析类 //设置mapper job.setMapperClass(mapperClass); job.setMapOutputKeyClass(mapKeyClass); job.setMapOutputValueClass(mapValueClass); //设置整个程序的输出 outputpath.getFileSystem(conf).delete(outputpath, true);//如果当前输出目录存在,删除之,以避免.FileAlreadyExistsException FileOutputFormat.setOutputPath(job, outputpath); job.setOutputFormatClass(outputFormat); //设置reducer,如果有才设置,没有的话就不用设置 if (null != reducerClass) { job.setReducerClass(reducerClass); job.setOutputKeyClass(outkeyClass); job.setOutputValueClass(outvalueClass); } return job; }}
程序
工具
代码
开发
一行
输入
输出
不用
内容
就是
文件
目录
重复性
驱动程序
运行
驱动
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库移植性好的框架
数据库poc工程师
西南证券软件开发社招
杭州坚端网络技术
成都人工智能软件开发哪家便宜
网络安全岗位好找吗
河源租房软件开发
p开头数据库单词
实现并发请求的网络服务器
江苏北斗网络时钟服务器
黄石港区群英网络技术开发中心
线上网络安全专业知识竞赛
服务器能存多少内存
中通吉网络技术有限
德阳网络安全监管
网络安全主流技术分析
服务器网络数据异常
网络安全应急演练的方案
柳州市网络安全教育网
广州社交软件开发定制
数据库如何表示外码
供电公司网络安全分析会
网站服务器查询
网络安全岗位有哪些执业规则
空智互联网科技有限公司
中通吉网络技术有限
哈尔滨龙品云购互联网科技
软件开发人才保险面试题
率土之滨服务器选择
数据库两表数据合并