Spark 整合hive 实现数据的读取输出
发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,实验环境: linux centOS 6.7 vmware虚拟机spark-1.5.1-bin-hadoop-2.1.0apache-hive-1.2.1eclipse 或IntelJIDea 本次使
千家信息网最后更新 2025年12月01日Spark 整合hive 实现数据的读取输出
实验环境: linux centOS 6.7 vmware虚拟机
spark-1.5.1-bin-hadoop-2.1.0
apache-hive-1.2.1
eclipse 或IntelJIDea 本次使用eclipse.
代码:
import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.sql.DataFrame;import org.apache.spark.sql.hive.HiveContext;public class SparkOnHiveDemo {public static void main(String[] args) { // 首先还是创建SparkConf SparkConf conf = new SparkConf().setAppName("HiveDataSource"); // 创建JavaSparkContext JavaSparkContext sc = new JavaSparkContext(conf); // 创建HiveContext,注意,这里,它接收的是SparkContext作为参数,不是JavaSparkContext HiveContext hiveContext = new HiveContext(sc.sc()); //1.可以使用HiveContext 下面的sql(xxx语句)执行HiveSQL语句 //1 .删除表,创建表 // stars_infos ,stars_scores hiveContext.sql("DROP TABLE IF EXISTS stars_infos"); hiveContext.sql("CREATE TABLE IF NOT EXISTS stars_infos(name STRING,age INT) " + "row format delimited fields terminated by ','"); //2.向表里面导入数据 hiveContext.sql("LOAD DATA " + "LOCAL INPATH " + "'/root/book/stars_infos.txt' " + "INTO TABLE stars_infos"); hiveContext.sql("DROP TABLE IF EXISTS stars_scores"); hiveContext.sql("CREATE TABLE IF NOT EXISTS stars_scores(name STRING,score INT) " + "row format delimited fields terminated by ','"); hiveContext.sql("LOAD DATA " + "LOCAL INPATH " + "'/root/book/stars_score.txt' " + "INTO TABLE stars_scores"); //3.从一张已经存在的hive表里面拿数据,转换为DF DataFrame superStarDataFrame = hiveContext.sql("SELECT si.name,si.age,ss.score " + "FROM stars_infos si " + "JOIN stars_scores ss ON si.name=ss.name " + "WHERE ss.score>=90"); //4.把DF的数据再持久化到hive中去,千万别和registerTemtable搞混了 hiveContext.sql("DROP TABLE IF EXISTS superStar"); superStarDataFrame.saveAsTable("superStar"); //5.直接从Hive中得到DF hiveContext.table("superStar").show(); sc.close(); }}元数据:
可以下载附件,然后上传到指定的目录下。
把程序打包jar后上传到linux指定的目录下,写一个脚本。脚本附件见正文。具体内容修改即可。
运行脚本就可以了。当然要保证MySQL数据库正常,hive正常。
附件:http://down.51cto.com/data/2366931
数据
脚本
附件
目录
语句
代码
内容
参数
数据库
正文
环境
程序
还是
面的
保证
实验
运行
整合
输出
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
德州企业管理软件开发费用
人事管理系统实现数据库设计
微博网络安全通信管理员
qq王者之前的服务器找不到
华为网络技术大赛大纲
荒野日记连接不上服务器
在线考试系统数据库的连接
医生和软件开发
网络安全黑板报简单又漂亮
查看运行web服务器的账号
走进网络安全科技馆
警察网络安全与隐私
网络安全常识50字
共享网络安全红利
浙江安防时钟监控网管服务器
吃鸡怎么切换服务器
网络安全收获与体会
网络安全小绝招
东莞广东网络安全培训
关注网络安全的宣传语
济南软件开发公司图片
数据库技术确定系统范围和边界
psn香港服务器
泉州市志腾网络技术有限公司
如何判断数据库有新数据写入
网络安全创作宣传画
行唐软件开发者在线咨询
海南网络安全培训中心
cbm数据库的单字通配符号
数据库结构设计图是er图吗