hive如何开启lzo压缩
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,这篇文章给大家分享的是有关hive如何开启lzo压缩的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。hive开启lzo压缩1.Hadoop安装lzo依赖并进行配置涉及到jar
千家信息网最后更新 2025年12月02日hive如何开启lzo压缩
这篇文章给大家分享的是有关hive如何开启lzo压缩的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
hive开启lzo压缩
1.Hadoop安装lzo依赖并进行配置
涉及到jar包的编译以及core-site文件的配置
可以在mapred-site文件中,设置是在map还是reduce端开启压缩。在这里只是设置mapreduce的压缩。hadoop和hive是可以单独设置的。
2. 在hive中开启压缩以及设置压缩方式
在hive客户端中设置参数,开始hive的map或者reduce端的压缩。
set mapred.output.compress=true;set hive.exec.compress.output=true;# 必须是LzopCodec才支持切片set mapred.output.compression.codec=com.hadoop.compression.lzo.LzopCodec;
3. 创建表指定InputFormat以及OutFormat
CREATE EXTERNAL TABLE ods_log (`line` string) PARTITIONED BY (`dt` string) STORED AS INPUTFORMAT 'com.hadoop.mapred.DeprecatedLzoTextInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'LOCATION '/warehouse/gmall/ods/ods_log';
INPUTFORMAT 是指从表中读取时,支持从lzo文件中读取
OUTPUTFORMAT是指写入数据到文件,输入数据的格式
4. 上传数据到表中
load data inpath '/origin_data/gmall/log/topic_log/2020-06-14' into table ods_log partition(dt='2020-06-14');
将数据导入到hive中后,数据会保存在lzo文件中
5. 为lzo文件创建索引
hadoop jar /opt/module/hadoop-3.1.3/share/hadoop/common/hadoop-lzo-0.4.20.jar com.hadoop.compression.lzo.DistributedLzoIndexer /warehouse/gmall/ods/ods_log/dt=2020-06-14
感谢各位的阅读!关于"hive如何开启lzo压缩"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
文件
数据
内容
更多
篇文章
支持
配置
不错
实用
参数
只是
客户
客户端
文章
方式
是在
格式
看吧
知识
端的
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
高考历年录取分数线数据库河南
威海容海网络技术
主机写入数据库
服务器设置管理口ip
顺义区技术软件开发服务咨询报价
数据库分表路由算法
长沙裕帮软件开发有限公司
连接数据库技术
网络安全行业企业有多少家
我的世界速建服务器ip
税控服务器管理系统进不去
高陵区软件开发公司
浙江省电子政务网络安全
湖州旅游团软件开发
贵港市公安局网络安全宣传
谈谈网络安全
网络安全到底还能去学么
数控和网络技术
机房网络安全运维培训的内容
通信软件开发工程师笔试题
芜湖电商软件开发要多少钱
脉享圈app软件开发
武汉企业软件开发团队
焦点科技是互联网大公司吗
网络安全钓鱼宣传语录
游戏服务器会被什么攻击
vip上面的服务器地址是啥
软件开发项目角色简称
软件开发文档通用要求GB
商超网站前段用什么软件开发