dkfr.net
当前位置:首页 >> hADoop,storm和spArk的区别,比较 >>

hADoop,storm和spArk的区别,比较

Storm优势就在于Storm是实时的连续性的分布式的计算框架,一旦运行起来,除非你将它杀掉,否则它一直处理计算或等待计算的状态.Spark和hadoop都做不到. 当然它们各自都有其应用场景,各有各的优势.可以配合使用. 下面我转一份别人的资料,讲的很清楚....

Storm优势就在于Storm是实时的连续性的分布式的计算框架,一旦运行起来,除非你将它杀掉,否则它一直处理计算或等待计算的状态.Spark和hadoop都做不到. 当然它们各自都有其应用场景,各有各的优势.可以配合使用. 下面我转一份别人的资料,讲的很清楚....

Hadoop 当前大数据管理标准之一,运用在当前很多商业应用系统。可以轻松地集成结构化、半结构化甚至非结构化数据集还是离线处理,批处理比较多,用的比较广的是hive Storm 用于处理高速、大型数据流的分布式实时计算系统。为Hadoop添加了可靠的...

应用场景不同不好比较。一般storm拿来做实时流数据的需求,而spark更适合拿来做离线数据分析。hadoop是生态圈,这里就假设你问的是hadoop核心计算框架mr.sprak和mr都适合拿来做离线数据分析,spark是快启动,在数据量不是非常大的时候(TB级别)...

Storm用于处理高速、大型数据流的分布式实时计算系统。为Hadoop添加了可靠的实时数据处理功能 Spark采用了内存计算。从多迭代批处理出发,允许将数据载入内存作反复查询,此外还融合数据仓库,流处理和图形计算等多种计算范式。Spark构建在HDFS...

spark与hadoop的比较我就不多说了,除了对硬件的要求稍高,spark应该是完胜hadoop(Map/Reduce)的。storm与spark都可以用于流计算,但storm对应的场景是毫秒级的统计与计算,而spark(stream)对应的是秒级的。这是主要的差别。一般很少有对实...

storm是实时处理,spark和hadoop是批处理,两者是互补。 而spark和hadoop比较的话,spark主要是充分利用内存计算并且支持更多的操作而不仅是map/reduce,这样有些迭代密集的算法执行效率会更高。而hadoop可能需要多个mr任务来完成。 在2.0之后,...

storm是流式计算,思想就是把数据放到计算上,对于流式数据肯定有优势 spark思想相反是把计算放到数据上,适用于批处理 不过spark streaming是把小的block放到计算上,是spark的流式计算和storm项目也有一定延迟

理论上来讲,学习spark和storm是不需要学习hadoop的。spark和storm都是独立的开源项目,在完整性上是self-constrained的,完全可以独立学习。从循序渐进的角度,还是可以了解一下hadoop的,以spark为例,理解了hadoop的mapreduce,知道它的缺陷...

Apache Spark和Apache Store的区别是什么?他们各自适用于什么样的应用场景?这是stackoverflow上的一个问题,这里整理简要版回答如下: Apache Spark是基于内存的分布式数据分析平台,旨在解决快速批处理分析任务、迭代机器学习任务、交互查询...

网站首页 | 网站地图
All rights reserved Powered by www.dkfr.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com