体系结构复习5——仓库级计算机的并行

体系结构复习 CH8 仓库级计算机的并行

注:本章不做重点要求,简略复习


8.1 仓库级计算机

8.1.1 仓库级计算机WSC

一般把作为商用因特网基础的超大型规模的集群称做仓库级计算机(WSC),WSC的建设主要关心:

  • 成本和性能
  • 能耗效率
  • 可靠性(冗余备份)
  • 网络I/O
  • 工作负载平衡
  • 并?性
  • 运?成本
  • 规模

计算WSC的可靠性(通过软件冗余来屏蔽停用次数):

availability =全年宕机时间全年时间=软件故障次数×软件系统重启时间+硬件故障次数×硬件系统修复时间全年时间

8.1.2 WSC和HPC对比

HPC是高性能计算机(集群),HPC和WSC不同之处在于:

  1. HPC节点间网络比WSC快的多,且程序独立性强,通信频繁
  2. HPC倾向于定制硬件,而WSC实用大众化商用芯片降低成本
  3. HPC强调线程级并行或数据级并行,而WSC强调请求级并行
  4. HPC常常满负载持续数周完成大规模运行作业,而WSC是面向并发请求的,通常不会满负载

8.1.3 仓库级计算机体系结构

机架是容纳服务器、交换机等的外壳框架,一个机架上往往放置有多个服务器,服务器通过机架交换机通信;服务器阵列由多个机架排列成的二维阵列构成,阵列内部机架间通过阵列交换机通信

因此WSC访存类型有三种:

  • 本地访问
  • 机架内服务器访问
  • 阵列内服务器访问

平均存储器延迟是各种访问方式(延迟)的加权平均值

8.2 云计算

8.2.1 云计算

云计算是一种按使用量付费服务模式,这种模式提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互(美国国家标准与技术研究院定义)

一般把云计算服务分成三种:

  • IaaS(基础设施即服务):以服务的形式提供虚拟硬件资源(如虚拟主机、存储、?络、数据库管理等资源),用户无需购买服务器、网络设备、存储设备,只需通过互联网租赁即可搭建?己的应?系统,例如AWS、阿里云VPS等
  • PaaS(平台即服务):提供应用服务引擎(如互联?应用编程接口、运行平台等),?户基于该应?服务引擎,可以使用API构建该类应用,如GAE、SAE等
  • SaaS(软件即服务):用户通过Internet来使用软件,不必购买软件,只需按需租用软件服务即可,如Google Docs、Oracle CRM On Demand等

8.2.2 云计算关键技术

  • 虚拟化:硬件资源虚拟化、网络设施虚拟化、应?虚拟化、桌?虚拟化等
  • 分布式存储:Google GFS、Hadoop HDFS
  • 并行编程:Hadoop MapReduce
  • 数据管理:Google BigTable、Hadoop HBase
  • 分布式资源管理:Google Chubby

8.3 Hadoop MapReduce简介

8.3.1 MapReduce基础

MapReduce是Google提出的一个软件架构,?于大规模数据集(?于1TB)的并行运算。当前的软件实现是指定一个Map(映射)函数,?来把一组键值对映射成一组新的键值对;指定并发的Reduce(化简)函数,?来保证所有映射的键值对中的每一个共享相同的键组

MapReduce系统主要由三个模块组成:

  • 客户端用于将用户撰写的并行处理作业提交至Master节点
  • 主节点(Master)自动将用户作业分解为Map任务和Reduce任务,并将任务调度到工作节点(Worker)
  • 工作节点向master请求执?任务,同时多个?作节点组成的分布式文件系统HDFS?于存储输入输出数据

8.3.2 MapReduce工作流程

  1. MapReduce库先把user program的输入文件划分为M份(由输入文件的大小和用户定义的块大小决定)
  2. master是负责调度的,为空闲worker分配作业(Map作业或者Reduce作业
  3. 被分配了Map作业的worker,开始读取对应分片的输入数据,Map作业数量和split一一对应;Map作业从输入数据中抽取出键值对,每一个键值对都作为参数传递给map函数,map函数产生的中间键值对被缓存在内存中。
  4. 缓存的中间键值对会被定期写入本地磁盘,而且被分为R个区,R的大小是由用户定义的,将来每个区会对应一个Reduce作业;这些中间键值对的位置会被通报给master,master负责将信息转发给Reduce worker。
  5. master通知分配了Reduce作业的worker它负责的分区在什么位置,当Reduce worker把所有它负责的中间键值对都读过来后,先对它们进行排序,使得相同键的键值对聚集在一起。
  6. reduce worker遍历排序后的中间键值对,对于每个唯一的键,都将键与关联的值传递给reduce函数,reduce函数产生的输出会添加到这个分区的输出文件中。
  7. 当所有的Map和Reduce作业都完成了,master唤醒正版的user program,MapReduce函数调用返回user program的代码。
时间: 2024-11-13 06:31:34

体系结构复习5——仓库级计算机的并行的相关文章

体系结构复习4——线程级并行

体系结构复习 CH7 线程级并行 7.1 多处理器与线程级并行 7.1.1 多处理器体系结构 线程级并行是多处理器支持多个线程同时并行执行,多处理器体系结构大致分成两种: 对称共享存储器多处理器(SMP):又叫集中式共享存储器体系结构,核心数目较小并共享一个集中式的存储器,所有处理器能够平等地访问它(又称为UMA,一致存储器访问):SMP的存储结构大致分成三层:共享主存.共享缓存和专用缓存,本章最重要的讨论即是专用缓存和共享存储之间的一致性问题. 分布式共享存储(DSM):多处理采用物理分布式存

体系结构复习3——数据级并行

体系结构复习 CH6 数据级并行 6.1 数据级并行DLP和SIMD 数据级并行(Data Level Parallel,DLP)是指处理器能够同时处理多条数据,属于SIMD模型,即单指令流多数据流模型 继续挖掘传统ILP的缺陷: 提高流水线时钟频率可能导致CPI增加 每个时钟周期很难预取和译码多条指令 大型科学计算.媒体流处理局部性较差,Cache命中率低 并且SIMD模型有以下优点: SIMD可有效挖掘DLP,如矩阵运算.图像声音等多媒体数据处理 SIMD比MIMD更节能,对于一组数据相同操

体系结构复习1——指令级并行(循环展开和Tomasulo算法)

体系结构复习 CH5 指令级并行 5.1 指令级并行概念 5.1.1 指令级并行 指令级并行(ILP)指通过通过流水线等技术实现多条指令同时并行执行的并行技术 实现ILP主要的方法有: 依靠硬件动态发现和开发并行 依靠软件在编译时静态发现并行 5.1.2 指令间相关性 指令间的相关性限制了指令级的并行度,相关性主要分为(真)数据相关.名称相关和控制相关 (1)数据相关 指令i位于指令j的前面,下面两种情况下称指令j数据相关于指令i: 指令i生成的结果可能会被指令j用到 指令j数据相关于指令k,而

体系结构复习2——指令级并行(分支预測和VLIW)

第五章内容较多,接体系结构复习1 5.4 基于硬件猜測的指令级并行 动态分支预測是在程序运行时.依据转移的历史信息等动态确定预測分支方向.主要方法有: 基于BPB(Branch Prediction Buffer)和BHT(Branch History Table)的方法 高性能指令发送(High Performance Instruction Delivery) 5.4.1 基于BPB和BHT的方法 (1)1-bit BHT 分支指令PC的低位索引1位记录上一次转移是否成功(不是预測是否正确)

体系结构复习2——指令级并行(分支预测和VLIW)

第五章内容较多,接体系结构复习1 5.4 基于硬件推测的指令级并行 动态分支预测是在程序运行时,根据转移的历史信息等动态确定预测分支方向,主要方法有: 基于BPB(Branch Prediction Buffer)和BHT(Branch History Table)的方法 高性能指令发送(High Performance Instruction Delivery) 5.4.1 基于BPB和BHT的方法 (1)1-bit BHT 分支指令PC的低位索引1位记录上一次转移是否成功(不是预测是否正确)

练手级计算机,快来打怪

<兄弟连Python06前期计算器----知识点 import tkinter class jsq: #界面布局方法 def __init__(self): self.root=tkinter.Tk() self.root.minsize(300,450) self.root.maxsize(300,450) self.root.title('计算器') #全局化变量 #存储数字与符号变量 self.lists=[] #假定按下符号键为错 self.isPressSign=False #初始化界

体系结构复习2

计算机指令集结构 指令集结构的分类 区别不同指令集结构的主要因素:CPU中用来存储操作数的存储单元类型 CPU中用来存储操作数的存储单元的主要类型: a)       堆栈 b)       累加器 c)        通用寄存器组 将指令集结构分为三种类型 a)       堆栈结构 b)       累加器结构 c)        通用寄存器结构: i.            寄存器-寄存器结构(RR结构)所有操作数都是来自通用寄存器 优点:指令字长固定,指令结构间接,是一种简单的代码生成模

[云] 1、云服务器——从ILP\DLP\TLP谈起

1) ABOUT:ILP\DLP\TLP 1-1.ILP 大约在1985年之后的所有处理器都使用流水线来重叠指令的执行过,以提高性能.由于指令可以并行执行,所以指令之间可能实现这种重叠称为指令级并行(ILP) ILP大体有两种不同开发方法:(1)依靠硬件来帮助动态发现和开发并行:(2)依靠软件技术在编译时静态地发现并行.使用基于硬件的动态方法的处理器,包括Inter Core系列,在桌面和服务器市场上占主导地位.在个人移动市场,提高能耗效率通常是一个关键目标,所以设计人员开发较低级别的指令级并行

计算机三级网络技术备考复习资料zhuan

计算机三级网络技术备考复习资料   第一章  计算机基础 分析:考试形式:选择题和填空题,6个的选择题和2个填空题共10分,都是基本概念 1.计算机的四特点:有信息处理的特性,有广泛适应的特性,有灵活选择的特性.有正确应用的特性.(此条不需要知道) 2.计算机的发展阶段:经历了以下5个阶段(它们是并行关系):大型机阶段(46年ENIAC.58年103.59年104机).小型机阶段.微型机阶段(2005年5月1日联想完成了收购美国IBM公司的全球PC业务).客户机/服务器阶段(对等网络与非对等网络