并行计算基础&编程模型与工具

在当前计算机应用中,对快速并行计算的需求是广泛的,归纳起来,主要有三种类型的应用需求:

  1. 计算密集(Computer-Intensive)型应用,如大型科学project计算与数值模拟;
  2. 数据密集(Data-Intensive)型应用,如数字图书馆、数据仓库、数据挖掘和计算可视化等;
  3. 网络密集(Network-Intensive)型应用,如协同工作、遥控和远程医疗诊断等。

并行编程模型主要有三种:适用于共享内存的多线程编程模型。适用于分布内存的消息传递编程模型,混合编程模型。

在计算机系统中。处理器永远都是訪问离自己近期的存储空间速度最快,比方L1 cache->L2->本地节点内存->远程节点内存/磁盘,而各层次的存储容量跟訪问速度恰恰相反。

并行计算中,并行算法的设计是决定性能的关键。有些问题天生具有良好的并行性。比方待处理数据集合能够被较好的去耦,而有些问题则须要复杂的公式推导和转换以适合并行计算。同一时候,还要避免计算过程中可能出现的瓶颈。任务划分要充分考虑负载均衡特别是动态负载均衡,“对等”的思想是维护负载均衡和保持可扩展性的关键之中的一个,即在设计时尽量避免使用Master/Slave和Client/Server的模式。

1.并行机的体系

并行机的发展从SIMD到MIMD。衍生除了四种经典的体系结构模式:SMP(Symmetric Shared-Memory Multiprocessor。比方经常使用的多核机。可扩展性较差。处理器数目8~16个),DSM(Distributed Shared-Memory。物理存储器分布于各个处理节点,而逻辑地址空间採用统一编址,因此属于共享存储。訪存时间受限于网络带宽)。MPP(Massive Parallel Processor。由成百上千台处理机组成的大规模系统,国家综合实力的象征。。)。机群系统(Cluster。互联的同构或异构的独立计算机的集合体,每一个节点都有自己的存储器、I/O、操作系统,能够作为单机使用,节点之间採用商品网络互联,灵活性较强)。

硬件:多核CPU(Intel, AMD), GPU(Nvidia), CellBe(Sony&Toshiba&IBM -> game,包括一个主处理单元和8个协处理单元)

概念:数据总线 地址总线 控制总线 (寄存器)位数

2.并行编程模型和工具

– MPI –

MPI(Message Passing Interface)是一种消息传递编程模型。服务于进程通信。它不特指某一个对它的实现,而是一种标准和规范的代表,它是一种库描写叙述,而不是一种语言,易于使用且具有高可移植性。说白了就是一些编程接口。

– OpenMP –

Open Multi-Processing是适用于共享内存多处理器体系结构的可移植并行编程模型。接口由SGI公司发起。

包括编译指导、执行函数库和环境变量三部分,具有串行等价性(不管使用一个还是多个线程执行一个程序,都带来同样的结果,更易于维护和理解)和增量并行性(处理器从一个串行程序開始,一块接着一块的寻找那些值得并行化的代码段)。

OpenMPI的执行模型採用Fork-Join形式。即主线程-从线程。减少了并行编程的难度和复杂度。

编译器指导语句,visio studio支持,使得OpenMP既能够被看做并行程序也能够被看做串行程序,或者在保持串行程序部分不变的情况下,用户能够方便地将串行程序改写成并行程序。

– MapReduce –

Google。PageRank倒排表索引的构建。

Map把输入Input分解成中间的Key/Value对,Reduce把Key/Value合成终于输出Output。

– Hadoop –

MapReduce的开源版本号。HFDS,NameNode(JobTracker),DataNode(TaskTracker),集群架构。

– CUDA –

Nvidia公司开发的GPU并行计算工具。

– CellBe –

CellBe的主要目标是将PlayStation2的处理器性能提高10倍,2006年IBM还推出了Cell刀片计算机系统。

參考文献:《并行计算机编程基础》& CUDA课程

时间: 2024-12-21 18:22:36

并行计算基础&编程模型与工具的相关文章

老李分享: 并行计算基础&编程模型与工具 1

老李分享: 并行计算基础&编程模型与工具 在当前计算机应用中,对高速并行计算的需求是广泛的,归纳起来,主要有三种类型的应用需求: 计算密集(Computer-Intensive)型应用,如大型科学工程计算与数值模拟: 数据密集(Data-Intensive)型应用,如数字图书馆.数据仓库.数据挖掘和计算可视化等: 网络密集(Network-Intensive)型应用,如协同工作.遥控和远程医疗诊断等. 并行编程模型主要有三种:适用于共享内存的多线程编程模型,适用于分布内存的消息传递编程模型,混合

老李分享: 并行计算基础&编程模型与工具 2

2.并行编程模型和工具 – MPI – MPI(Message Passing Interface)是一种消息传递编程模型,服务于进程通信.它不特指某一个对它的实现,而是一种标准和规范的代表,它是一种库描述,而不是一种语言,易于使用且具有高可移植性.说白了就是一些编程接口. – OpenMP – Open Multi-Processing是适用于共享内存多处理器体系结构的可移植并行编程模型,接口由SGI公司发起.包含编译指导.运行函数库和环境变量三部分,具有串行等价性(无论使用一个还是多个线程运

并行计算基础&编程模型与工具

在当前计算机应用中,对高速并行计算的需求是广泛的,归纳起来,主要有三种类型的应用需求: 计算密集(Computer-Intensive)型应用,如大型科学工程计算与数值模拟: 数据密集(Data-Intensive)型应用,如数字图书馆.数据仓库.数据挖掘和计算可视化等: 网络密集(Network-Intensive)型应用,如协同工作.遥控和远程医疗诊断等. 并行编程模型主要有三种:适用于共享内存的多线程编程模型,适用于分布内存的消息传递编程模型,混合编程模型. 在计算机系统中,处理器永远都是

Fork/Join编程模型

1.一种并行计算的多线程编程模型 2.开始--任务分割--多线程异步执行---任务合并--阻塞等待合并结果.(分治算法) 3.work-stealing算法: 每个线程维护一个各自的双端的链表,有新任务时之间插入的前端优先执行,前端无任务时,窃取其他线程双端链表的任务加入到自己的尾端进行处理. 通常的情况下,并发的线程池都是维护一个共享的任务队列,新任务到来时插入到队列的尾部,而线程执行任务时取队列的首部任务,而Fork/Join编 模型刚好相反,优先处理新任务,新任务放在最前面优先执行.自己的

Spark入门实战系列--3.Spark编程模型(上)--概念及SparkShell实战

[注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送–Spark入门实战系列>获取 1 Spark编程模型 1.1 术语定义 应用程序(Application): 基于Spark的用户程序,包含了一个Driver Program 和集群中多个的Executor: 驱动程序(Driver Program):运行Application的main()函数并且创建SparkContext,通常用SparkContext代表Driver Program: 执行单元(Executor): 是为某

MapReduce 编程模型概述

MapReduce 编程模型给出了其分布式编程方法, 共分 5 个步骤:1) 迭代(iteration).遍历输入数据, 并将之解析成 key/value 对.2) 将输入 key/value 对映射(map) 成另外一些 key/value 对.3) 依据 key 对中间数据进行分组(grouping).4) 以组为单位对数据进行归约(reduce).5) 迭代. 将最终产生的 key/value 对保存到输出文件中.MapReduce 将计算过程分解成以上 5 个步骤带来的最大好处是组件化与

.net异步编程の-------异步编程模型(APM)

术语解释: APM               异步编程模型, Asynchronous Programming Model EAP                基于事件的异步编程模式, Event-based Asynchronous Pattern TAP                基于任务的异步编程模式, Task-based Asynchronous Pattern 一.异步编程 APM即异步编程模型的简写(Asynchronous Programming Model),大家在写代

Spark入门实战系列--3.Spark编程模型(下)--IDEA搭建及实战

[注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送–Spark入门实战系列>获取 1 安装IntelliJ IDEA IDEA 全称 IntelliJ IDEA,是java语言开发的集成环境,IntelliJ在业界被公认为最好的java开发工具之一,尤其在智能代码助手.代码自动提示.重构.J2EE支持.Ant.JUnit.CVS整合.代码审查. 创新的GUI设计等方面的功能可以说是超常的.IDEA是JetBrains公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨

基于任务的编程模型TAP

一.引言 在上两个专题中我为大家介绍.NET 1.0中的APM和.NET 2.0中的EAP,在使用前面两种模式进行异步编程的时候,大家多多少少肯定会感觉到实现起来比较麻烦, 首先我个人觉得,当使用APM的时候,首先我们要先定义用来包装回调方法的委托,这样难免有点繁琐, 然而使用EAP的时候,我们又需要实现Completed事件和Progress事件,上面两种实现方式感觉都有点繁琐,同时微软也意思到了这点,所以在.NET 4.0中提出了一个新的异步模式--基于任务的异步模式,该模式主要使用Syst