python map reduce的方法是什么
发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,本篇内容主要讲解"python map reduce的方法是什么",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"python map reduce的方法是什
千家信息网最后更新 2025年12月01日python map reduce的方法是什么
本篇内容主要讲解"python map reduce的方法是什么",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"python map reduce的方法是什么"吧!
执行shell脚本run.sh
#! /bin/bashIN_DIR="/input/20140221"OUT_DIR="/output/20140221"HPHOME=$HADOOP_HOME/bin/JAR_PACKAGE=$HADOOP_HOME/contrib/streaming/hadoop-streaming-0.20.2-cdh4u0.jarMAP_FILE=$(pwd)/map.pyRED_FILE=$(pwd)/red.py${HPHOME}hadoop fs -rmr $OUT_DIR${HPHOME}hadoop jar $JAR_PACKAGE \ -numReduceTasks 1 \ -jobconf mapred.job.queue.name=platform \ -input $IN_DIR \ -output $OUT_DIR \ -file $MAP_FILE \ -file $RED_FILE \ -mapper $MAP_FILE \ -reducer $RED_FILE \ -inputformat SequenceFileAsTextInputFormatexit $?map.py
#!/usr/bin/env pythonimport sysfor line in sys.stdin: line = line.strip() if line.find("str1")!=-1: item = line.split('\01') key = item[3] print '%s\t%s' % (key, 'str3') elif line.find("str2")!=-1: item = line.split('\01') key = item[2] value = item[5] print '%s\t%s\t%s' % (key, 'str3', value) else: passred.py
#!/usr/bin/env pythonfrom operator import itemgetterimport sysword2count = {}total_count = 0total_money = 0.0total_error = 0pre_pid = ''pre_money = 0.0is_pre_push = 0for line in sys.stdin: line = line.strip() if line.find('str3')!=-1: item = line.split('\t') total_money += float(item[2]) total_count += 1 else: passprint total_count, total_error, total_money ##最后才打印仅作为参考
hadoop默认以'\t'分隔key和value,第一个字段为key
到reduce时,相同key的都在一起被同一个red.py处理,故可以连续读取相同key的每一行。(java中相同key的都以数组的形式放在一次reduce中了,而python却仍要读取多行,但相同key的都排在一起)
到此,相信大家对"python map reduce的方法是什么"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
方法
相同
内容
学习
实用
更深
一行
兴趣
字段
实用性
实际
形式
操作简单
数组
更多
朋友
网站
脚本
频道
多行
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
音频网络技术
我重启一下服务器翻译
维护网络安全措施的是
确保网络安全的方式
山西省网络安全网上答题
数据库实训报告题目
连云港ibm服务器回收
办公软件开发就选臻动传媒
新泰电脑网络技术有要人的吗
梅州数字软件开发批发价格
聘请网络安全专家
云南 网络技术公司 滇池
mssql服务器安全
罗布乐思关闭服务器怎么回事
数据库与其他系统对接
数据库char后面的括号
怎么基于数据库
湖南益阳网络安全技能
网络安全重要作用
湖北巨幕服务器虚拟主机
集控系统的网络安全规范和标准
电力领域计算机与网络技术
道闸系统连接数据库的四种方式
沈阳东软网络安全事业部
高中生网络安全手抄报内容
数据库自定义连接字符串
浙江寻宝网络技术有限公司
美国首部网络安全法案
税控盘显示数据库错误怎么处理
变频器功能软件开发