千家信息网

Spark的应用有哪些

发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,本篇内容介绍了"Spark的应用有哪些"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、MapRed
千家信息网最后更新 2025年12月03日Spark的应用有哪些

本篇内容介绍了"Spark的应用有哪些"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

一、MapReduce将死,Spark称霸,Hadoop死而不僵

由于Hadoop的MapReduce高延迟的死穴,导致Hadoop无力处理很多对时间有要求的场景,人们对其批评越来越多,Hadoop无力改变现在而导致正在死亡。正如任何领域一样,死亡是一个过程,Hadoop正在示例这样的一个过程,Hadoop的死亡过程在2012年已经开始,迭代与算法的无力是硬伤。

拿出五分钟看看这个世界目前发生了什么?

1,原先支持Hadoop的四大商业机构纷纷宣布支持Spark;

2,Mahout前一阶段表示从现在起他们将不再接受任何形式的以MapReduce形式实现的算法,另外一方面,Mahout宣布新的算法基于Spark;

3,Cloudera的机器学习框架Oryx的执行引擎也将由Hadoop的MapReduce替换成Spark;

4,Google已经开始将负载从MapReduce转移到Pregel和Dremel上 - 其实Mapreduce的论文一开始是被抛弃,才被公布于世。

5,FaceBook则将负载转移到Presto上;

现在很多原来使用深度使用Hadoop的公司都在纷纷转向Spark,国内的淘宝是典型的案例。

在此,我们以使用世界上使用Hadoop最典型的公司Yahoo!为例,大家可以看一下其数据处理的架构图:

无非是实时和非实时的两条斗争的线路,在引入了Spark之后

随着时间的推进和Spark本身流处理、图技术、机器学习、NoSQL查询的出色特性可能会完成Spark全面取代Hadoop的计算能力,而这也代表了所有做云计算大数据公司的趋势。

hadoop越来越退化为一个标杆的文件系统下所抽象的容器。

或许有朋友会问,Hadoop为何不改进自己?

其实,Hadoop社区一直在改进Hadoop本身,世界就是这样,固有的事物总是强势,改革总不如革命来的猛烈。

1,Hadoop的改进基本停留在代码层次,也就是修修补补的事情,这就导致了Hadoop现在具有深度的"技术债务",负载累累;Hadoop2.0的扩展本章上就是:一旦不能驾驭某种事物,那就扩大自身的范畴,以期待完全的包含关系。

2,Hadoop本身的计算模型决定了Hadoop上的所有工作都要转化成Map、Shuffle和Reduce等核心阶段,由于每次计算都要从磁盘读或者写数据,同时真个计算模型需要网络传输,这就导致了越来越不能忍受的延迟性,同时在前一个任务运行完之前,任何一个任务都不可以运行,这直接导致了其无力支持交互式应用;

那么,为什么不全部重新写一个更好的Hadoop呢 ? 答案是Spark的出现使得没有必要这样做了。

Spark是继Hadoop之后,成为替代Hadoop的下一代云计算大数据核心技术,目前SPARK已经构建了自己的整个大数据处理生态系统,如流处理、图技术、机器学习、NoSQL查询等方面都有自己的技术,并且是Apache顶级Project,可以预计的是2014年下半年到2015年在社区和商业应用上会有爆发式的增长。

国外一些大型互联网公司已经部署了Spark。

甚至连Hadoop的早期主要贡献者Yahoo现在也在多个项目中部署使用Spark;

国内的淘宝、优酷土豆、网易、Baidu、腾讯等已经使用Spark技术用于自己的商业生产系统中,国内外的应用开始越来越广泛。

"Spark的应用有哪些"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!

技术 应用 数据 处理 公司 越来越 过程 越来 学习 世界 商业 机器 算法 系统 支持 事物 任务 典型 内容 同时 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 虚拟机my数据库清除 sql数据库查询随机一条信息 四川网络安全学院技术提升快 大工计算机网络技术09 我的世界服务器小游戏动漫 杭州计算机软件开发怎么样 大专考研软件开发的大学 金华公司网络安全准入控制哪家好 bcs2019网络安全 深度网络技术有限公司 云南工程软件开发外包 软件开发大专大专院校有哪些 怎么看数据库连接端口 上海万得软件开发会裁员吗 云主机服务器安全 管理会计软件开发方面 网络安全策略包括哪些 金融信用信息数据库 做好网络安全保障工作的函 珠海专业服务器散热器供应 网络安全法如何确定负责人 服务器模组电脑配置推荐 男子自学网络技术成黑客 数据库图形代表什么 网络安全技术措施是什么东西 现代化软件开发设计规范 微服务架构数据库打通 适合开发的数据库应用系统是 做好网络安全保障工作的函 湖南网络技术创新服务
0