MapReduce Map Join怎么使用
发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,这篇文章主要介绍"MapReduce Map Join怎么使用",在日常操作中,相信很多人在MapReduce Map Join怎么使用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希
千家信息网最后更新 2025年12月01日MapReduce Map Join怎么使用
这篇文章主要介绍"MapReduce Map Join怎么使用",在日常操作中,相信很多人在MapReduce Map Join怎么使用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"MapReduce Map Join怎么使用"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
1. 样例数据
011990-99999 SIHCCAJAVRI012650-99999 TYNSET-HANSMOEN
012650-99999 194903241200 111012650-99999 194903241800 78011990-99999 195005150700 0011990-99999 195005151200 22011990-99999 195005151800 -11
2. 需求
3. 思路、代码
将足够小的关联文件(即气象台信息)添加到分布式缓存,然后在每个 Mapper 端读取被缓存到本地的全量气象台信息,再与天气信息相关联。
import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Job;import org.apache.hadoop.mapreduce.Mapper;import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;import org.apache.hadoop.util.GenericOptionsParser;import java.io.BufferedReader;import java.io.FileReader;import java.io.IOException;import java.util.HashMap;import java.util.Map;public class MapJoin { static class RecordMapper extends Mapper { private Map stationMap = new HashMap(); @Override protected void setup(Context context) throws IOException, InterruptedException { //预处理,把要关联的文件加载到缓存中 Path[] paths = context.getLocalCacheFiles(); //新的检索缓存文件的API是 context.getCacheFiles() ,而 context.getLocalCacheFiles() 被弃用 //然而 context.getCacheFiles() 返回的是 HDFS 路径; context.getLocalCacheFiles() 返回的才是本地路径 //这里只缓存了一个文件,所以取第一个即可 BufferedReader reader = new BufferedReader(new FileReader(paths[0].toString())); String line = null; try { while ((line = reader.readLine()) != null) { String[] vals = line.split("\\t"); if (vals.length == 2) { stationMap.put(vals[0], vals[1]); } } } catch (Exception e) { e.printStackTrace(); } finally { reader.close(); } super.setup(context); } @Override protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String[] vals = value.toString().split("\\t"); if (vals.length == 3) { String stationName = stationMap.get(vals[0]); //Join stationName = stationName == null ? "" : stationName; context.write(new Text(vals[0]), new Text(stationName + "\t" + vals[1] + "\t" + vals[2])); } } } public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs(); if (otherArgs.length != 3) { System.err.println("Parameter number is wrong, please enter three parameters: 4. 运行结果
到此,关于"MapReduce Map Join怎么使用"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!
缓存
文件
学习
信息
关联
更多
气象
气象台
路径
帮助
实用
接下来
代码
分布式
多个
天气
思路
数据
文章
方法
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
amesim数据库
英雄的远征服务器
自家住宅可以用作服务器机房吗
mogondb配置数据库
我的世界服务器崩了意味着什么
怀柔区深信服数据库安全审计
山西高智通信网络技术有限公司
数据库代码中nid什么意思
商丘中等计算机网络技术
服务器添加cpu
自学手机软件开发要多长时间
数据库首显示字母大写
计算机网络技术及答案
危险源风险点数据库
自己搭建网站服务器怎么备案
大连高新区 软件开发
驰韩软件开发
网络安全审计考试
学好网络技术能干啥
用友t6管理服务器在哪里
类似cad的软件开发
软件开发线下推广
北京品质软件开发设施价格优惠
Linux环境下软件开发
db2创建新数据库sql
服务器存储管理总结
信誉可靠的服务器监控工具
舌诊数据库
无锡游戏软件开发创新服务
中餐智慧餐饮软件开发