Hive初识
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,Hive产生背景:在给大家讲解Hive之前,我们要先熟悉下Hadoop的一些概念。Hadoop可以分为一下几个部分 HDFS hadoop的文件系统,用于数据存储 MapReduce 用于
千家信息网最后更新 2025年12月02日Hive初识
Hive产生背景:
在给大家讲解Hive之前,我们要先熟悉下Hadoop的一些概念。
Hadoop可以分为一下几个部分 HDFS hadoop的文件系统,用于数据存储 MapReduce 用于数据处理 Yarn 用于资源管理那Hadoop 中的MapReduce程序一般处理输入都是一些标准化的日志,假设我们有如下的日志文件。姓名 科目 成绩张三 语文 90李四 语文 80王五 语文 88张三 数学 99李四 数学 98王五 数学 90我们需要对这些数据进行处理,如获取成绩最高者、统计平均分等。那么没做一次处理我们就需要像写八股文似的进行编写MapReduce程序: 1、编写Mapper 2、编写Reducer 3、编写main 4、在main中定义job 5、设置job的输入、输出以及参数 6、执行job这样就需要我们对MapReduce编程十分的熟悉,并且这种方式比较费时费力。同时,在一般的公司中,对这种有固定格式的数据进行处理我们一般都交由专门的DB进行处理,但是DB又对MapReduce的编程不了解,让他们编写MapReduce程序来处理数据就不太现实,那有没有一种或者一个工具,能让他们使用类似sql的方式来清洗数据。答案当然是有的,那就是我们的Hive。Hive是什么
Hive是一个在hadoop基础上来处理结构化数据的数据仓库基础工具。这里说它是一个工具,它主要的功能就是方便我们处理数据,但是数据的存储等还是在HDFS上。
Hive是架构在Hadoop之上,可以提供类似SQL语言的查询语句进行简化大数据的处理以及清晰,
方便DB进行数据处理。
Hive开始是有Facebook开发,后由Apache软件基金会开发,并将其Apache下的一个顶级项目。
Hive为一个开源项目,它用在好多不同的公司。
Hive的特点
1、它不像关系型数据库只能处理少量的数据,hive由于架构在Hadoop之上,本身就赋予了其处理大数据的能力。2、它提供一种类似SQL的查询语言,叫HQL或者HiveQL。3、由于本身就是在MapReduce上进行的二次扩展,因此hive就具有了良好的可扩展型,如果出现一个hive提供不了的处理,我们可以通过编写mapreduce程序,将其封装成hive的一个函数。hive的基本原理
HIve只是一个工具,他将HQL转换成MapReduce程序运行在Yarn上面,进行处理HDFS上存储的数据,这样就可以让我们对于简单的数据处理,只是编写一下HQL就可以了,不用在编写MapReduce程序。Hive架构

用户在使用Hive的过程中,通过CLI、JDBC/ODBC、WebUI等方式,提供HQL语句到hive中,hive通过编译、优化、执行,将经过优化的HQL语句进行转换成MapReduce程序放到yarn上运行。
针对开始提出的查询成绩最高的那一行,我们只需要写如下的HQL就可以了:
select * from table order by sorce desc limit 0,1
到此,整个hive的介绍就个大家讲解完成了,在下一篇中,我们讲会讲解hive的安装
数据
处理
程序
工具
就是
成绩
数学
数据处理
方式
架构
语句
语文
存储
查询
最高
公司
只是
基础
文件
日志
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
服务器是虚拟的吗
一般公司服务器安装什么版本
wex5 服务器
忍三如何更改服务器
绝地求生改了服务器后还能联机吗
网络安全溯源培训
程序员和软件开发啥关系
重庆正规软件开发定制费用
武夷山定制软件开发
云服务器兼容哪个软件好
网络技术时间间隔
服务器坏了怎么判断
软件开发系统维护学什么
金蝶出纳软件开发
山东滨州网络安全吗
工管企业数据库信息证书
手机小程序数据库
造艺网络技术诈骗
电力系统用什么数据库最好
安阳数据库
如何检查服务器硬盘健康状态
求生之路怎么制作服务器
南阳市司法局网络安全培训会
ios 获取服务器数据
网络安全面临的威胁分为几级
sql备份数据库怎么找回来
平安网络安全认证
pg数据库最新操作手册
国内论文数据库
国外医药数据库有哪些new