千家信息网

pig怎么安装

发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,这篇文章给大家分享的是有关pig怎么安装的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。查看Hadoop对应的pig版本 http://www.aboutyun.com/bl
千家信息网最后更新 2025年12月01日pig怎么安装

这篇文章给大家分享的是有关pig怎么安装的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

查看Hadoop对应的pig版本 http://www.aboutyun.com/blog-61-62.html

要我们使用start-dfs.sh和start-yarn.sh来进行启动Hadoop

在,/home/hadoop/.bashrc文件中添加如下红色信息
#set java environment
PIG_HOME=/home/hadoop/pig-0.9.2
HBASE_HOME=/home/hadoop/hbase-0.94.3
HIVE_HOME=/home/hadoop/hive-0.9.0
HADOOP_HOME=/home/hadoop/hadoop-1.1.1
JAVA_HOME=/home/hadoop/jdk1.7.0
PATH=$JAVA_HOME/bin:$PIG_HOME/bin:$HBASE_HOME/bin:$HIVE_HOME/bin:$HADOOP_HOME/bin:$PATH
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$HBASE_HOME/lib:$PIG_HOME/lib:$HIVE_HOME/lib:$JAVA_HOME/lib/tools.jar
export PIG_HOME
export HBASE_HOME
export HADOOP_HOME
export JAVA_HOME
export HIVE_HOME
export PATH
export CLASSPATH
重启机器或用source命令使文件生效。

切换到.bashrc文件路径下然后

source .bashrc

如果执行pig命令 permission denied 则 chmod +x pig 使其变成可执行文件

运行Pig程序示例

运行一个简单的示例,就是把linux下的/etc/passwd文件的第一列提取出来输出,用MapReduce模式跑,效果就是输入所有用户名

首先把/etc/passwd文件put到hadoop的hdfs上,命令如下

hadoop fs -put /etc/passwd /user/root/passwd

然后进入Pig shell,运行命令,以':'分隔提取A,然后把A的第一列放入B,dump打出B

[root@hadoop-namenodenew]# piggrunt> A = load 'passwd' using PigStorage(':');grunt> B = foreach A generate $0 as id;        grunt> dump B;

输出如下:

(省略几万字....)Input(s):Successfully read 29 records (1748 bytes) from: "hdfs://192.168.12.67:8020/user/root/passwd"Output(s):Successfully stored 29 records (325 bytes) in: "hdfs://192.168.12.67:8020/tmp/temp1558767875/tmp-1327634226"Counters:Total records written : 29Total bytes written : 325Spillable Memory Manager spill count : 0Total bags proactively spilled: 0Total records proactively spilled: 0Job DAG:job_1401631066126_0005(省略几万字....)(root)(bin)(daemon)(adm)(lp)(sync)(shutdown)(halt)(mail)(uucp)(operator)(games)(gopher)(ftp)(nobody)(dbus)(vcsa)(rpc)(abrt)(rpcuser)(nfsnobody)(haldaemon)(ntp)(saslauth)(postfix)(sshd)(tcpdump)(oprofile)(riak)

感谢各位的阅读!关于"pig怎么安装"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

文件 命令 运行 内容 就是 更多 示例 篇文章 输出 不错 实用 信息 效果 文章 机器 模式 版本 用户 用户名 看吧 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 天津软件开发王涛 第3章计算机网络技术基础练习题 应用软件开发价格是多少 北京银火之光网络技术有限公司 服务器管理维护运维书籍 数据库如何解决不可重复读 淄博供热站自动化控制软件开发 如何使数据库表能存入中文 苏州网升网络技术有限公司 如何设置虚拟服务器教程视频 孝感软件开发企业 巧房系统数据库抓取 四川语音网络技术分类服务保障 无锡企业网络安全处罚 宝山区无线网络技术常见问题 服务器管理器 安装iis 存储过程调用数据库速度 美国华人软件开发 联想服务器硬盘架指示灯 网络安全 宣传方案设计 srat网络安全联盟 ip电话网关服务器 app专业软件开发服务 桌面无法连接到服务器 中山粤来越牛互联网科技 网络安全维护实习 网络安全技术应用试点示范申报 双流国家网络安全周 联合国数据库旅游服务贸易 联想服务器硬盘架指示灯
0