其实提到haddoop,一般也会想到分布式架构,只是它与分布式架构之间又有些区别,所有你是否了解其区别与联系呢?有兴趣的朋友们可以跟小编一起来看看呢。
hadoop简单点来说就是用了java语言写的分布式架构 ,用来处理大数据的框架,主要思想就是所谓的分组与合并思想了。
所谓分组:就是比如说有一个大型数据,那么就会把这个数据按照算法来分成若干份,然后每份都存储在从属主机上,还会在从属主机上头进行计算,主节点就主要负责hadoop的两个关键功能模块即HDFS和Map Reduce的相关监督。
合并:就是把每个机器上的计算结果都合并起来再在一台机器上进行计算,来得到最终的结果。这就是mapreduce算法。
hadoop的核心设计如下图所示:
hadoop主要的任务部署是分为3个part的,分别是:Client机器,主节点,从节点。主节点就是主要负责Hadoop两个关键功能模块HDFS、Map Reduce的相关监督。所以当Job Tracker使用了Map Reduce进行了监控和调度数据的并行处理的时候,名称节点就得负责HDFS监视和调度了。从节点就负责了机器运行的绝大部分了,承担了所有数据储存和指令计算的苦差事。而且每个从节点既是数据节点的角色又是与他们主节点通信的守护进程。要知道守护进程是隶属于Job Tracker的,数据节点是归属于名称节点的。
好了,以上就是本篇文章的全部内容了,还想了解更多java架构师相关内容,记得关注本站消息,获取更多信息哦。
推荐阅读: