(1)hadoop1.x 和 hadoop2.x对比
hadoop1.x:
- JobTracker做资源管理和任务调度,存在单点问题,如果集群扩张,TaskTracker变多,JobTracker压力就会变大(因为是1对多,只有1个JobTracker);如果JobTracher挂掉无法提交
- 只支持mr作业,不支持其他类型作业(spark等)
- 静态资源分配,资源利用率不好
hadoop2.x:
- 支持mr以外的其他作业
- 可以通过配置任务队列优先级,跑多种作业等方式提高资源利用率
- 1个resourmanager对应多个nodemanager,resourcemaneger支持HA(但是存在问题,需要额外操作实现真正的HA)
(2)ApplicationMaster职责是什么?
作业提交到ResourceManager上,它会启动一个Container,在Container上启动作业对应的ApplicationMaster(MR作业就是MR Application Master,也可能是Spark的),ApplicationMaster向ResourceManager申请计算资源,到对应的NodeManager上启动Container运行程序,ApplicationMaster完成的是和ResourceManager通信请求自愿,和NodeManager通信完成任务的分发,启动停止,作业的容错等
相关推荐
理清Hadoop1.x与Hadoop2.x区别,对比分析。 Hadoop是大数据惊世之作,必学的东西,需要知道: 它由哪些部分组成? 各自的作用是什么? 如果工作的?
hadoop2.x 介绍,及对比hadoop1.x的区别。hadoop2.x的新特性的详细介绍。
Hadoop3版本中添加了哪些新功能,Hadoop3中兼容的Hadoop 2程序,Hadoop 2和Hadoop 3有什么区别? 二、Hadoop 2.x与Hadoop 3.x比较 本节将讲述Hadoop 2.x与Hadoop 3.x之间的22个差异。 现在让我们逐一讨论 2.1...
云帆大数据hadoop-1.2.1-PPT-02 Hadoop 1.x介绍、本地(单机)模式和伪分布式安装与测试
2 .5.3 BlockToken 认证与HDFS 的Sas I 认证对比…… ……… ........…......................... 97 VII 2.6 HDFS 内部的磁盘目录服务…..... .. .... .... ......….... ...... ....…….......….... ....….. ....
主要介绍了Hadoop的应用场景、主要特点和架构设计,并对比了Hadoop1.x, 2.x和3.x版本的主要差异
08_数仓采集_框架版本具体型号.avi1 x& Q/ D. O' l 09_数仓采集_服务器选型.avi3 _: b. H. i! a; O8 V3 A7 [1 s0 t; B 100_业务数仓_DWS层之用户行为宽表.avi* o! `2 N, _5 u& a$ W 101_业务数仓_需求九:GMV成交...
CDH6相对于CDH5是一次各个组件的大版本升级,要理解大版本更新,这里先解释一下Hadoop相关组件的版本说明。比如版本号是x.y.z,z代表的一般是Maintenance Version或Patch Version,这种版本升级主要修复bug,不改动...
第 2 章方案设计和技术选型: 聚类… … … ..... 60 2.1 聚类的基本概念…………........….. 60 2.2 算法: K 均值和层次型聚类…… 61 2.2.1 K 均值聚类………… ... ......… 61 2.2.2 层次型聚类………………...