2018年12月29日 下午3:48
注:这里就是概念的学习,但是要认识到概念的重要性
遇到问题解决问题:
编程模型

注:一个原始文件被HDFS-》每个数据块-》一个map-》一个线程
计算框架要解决的两个主要问题:

模式这个词代表着可重复
MapReduce 计算框架

shuffle:

Yarn架构:
注:我觉得原理非常简单,先别看任何资料去理解:老板(资源管理器)总需要一些得力二把手(applicationMaster),老板的任务是管好这些二把手,二把手需要资源时向boss申请就行,老板不用再管各个二把手具体的任务了。当然这个过程也要有监工(节点管理器),去监督自己的服务器是否好好干活。

框架的判断原则:依赖倒转原则
