计算机系统结构总结_Memory Hierarchy and Cache Optimization

Textbook:

《计算机组成与设计——硬件/软件接口》　　HI

《计算机体系结构——量化研究方法》　　QR

Ch4. Cache Optimization

本章要讨论的问题就是 How to Improve Cache Performance?

前面讲过 Average memory access time = HitTime + (MissRate * MissPenalty)

那么我们的方向就是Reduce MissRate / HitTime / MissPenalty

1. 6 Basic Cache Optimization(PPT P3)

• Reducing hit time

1. Giving Reads Priority over Writes
• E.g., Read complete before earlier writes in write buffer ？？

2. Avoiding Address Translation during Cache Indexing

Cache中使用虚拟地址，这样就可以同时Access TLB和Cache / Access Cache firstly

• Reducing Miss Penalty

3. Multilevel Caches

AMAT = Hit TimeL1 + Miss RateL1 x Miss PenaltyL1
Miss PenaltyL1 = Hit TimeL2 + Miss RateL2 x Miss PenaltyL2

原来Miss PenaltyL1要访问内存，很慢。现在多了L2

• Reducing Miss Rate

4. Larger Block size (Compulsory misses)

...

5. Larger Cache size (Capacity misses)

...

6. Higher Associativity (Conflict misses)

...

2. 11 Advanced Cache Optimizations (PPT P12)

• Reducing hit time

1. Small and simple caches（QR P59）

2. Way prediction

3. Trace caches

• Increasing cache bandwidth

4. Pipelined caches

5. Multibanked caches

6. Nonblocking caches

• Reducing Miss Penalty

7. Critical word first

8. Merging write buffers

• Reducing Miss Rate

9. Compiler optimizations

• Reducing miss penalty or miss rate via parallelism

10. Hardware prefetching

11. Compiler prefetching

3. Main Memory Optimization (PPT P39)

...

原文地址：https://www.cnblogs.com/pdev/p/11621833.html

时间： 2024-10-10 14:42:27

计算机系统结构总结_Memory Hierarchy and Cache Optimization的相关文章

计算机系统结构（一）

第一章计算机系统结构基本概念 1.1.1.计算机系统的层次结构计算机系统是由硬件和软件组成的,按照功能划分为7个层次 0级机器有硬件实现是机器的硬件内核 1级机器有位程序(固件)实现 ,它根据各种指令的操作所需要的控制时序,配备一套微指令,编写微程序,控制信息在个寄存器之间的传送. 2级是传统的机器语言机器.这级的机器语言是该机的指令系统.机器语言的程序员用着记得指令系统编写的程序有第一级的为程序进行解释. 3级是操作系统机器 4级是汇编语言机器.有汇编语言编写的程序首先翻译成第3级或者第

计算机系统结构之重要知识点总结2

一．名词解释 1)虚拟机:指通过软件模拟具有完整硬件系统功能的,运行在一个完全隔离环境中的完整计算机系统 2)系统加速比:同一个任务在系统改进前花费总时间和在系统改进后花费总时间的比率 3)Amdahl定律:计算计算机系统中某个部件改进后能获得多少总性能提高的定律 4)系列机:由同一厂家生产的具有相同的系统结构,但是具有不同组成和实现的一系列不同型号的计算机 5)模拟:指用软件的方法在一台现有的计算机上实现另外一台计算机的指令集 6)仿真:指用一台现有计算机的微程序取解释实现另外一个计算机的指令

计算机系统结构，组成和实现

计算机系统结构的定义: 计算机系统结构是其所处环境中最高层次的概念,是对计算机系统中各个机器之间界面的划分和定义,以及对各级界面上,下的功能进行分配.也称为体系结构. 计算机体系结构指的是计算机系统设计的观念和架构,描述计算机在实际中所做的设计的原则. 计算机体系结构是从程序员的角度所看到的系统的属性,是概念上的结构和功能上的行为. 例如: 功能特性指令系统及其执行模式: 数据表示:硬件直接识别和处理的数据类型寻址技术:编址方式,寻址方式和定位方式寄存器定义:寄存器的定义,数量和使用规则指

计算机系统结构概述

计算机系统的多层次结构: 是从使用语言的角度,基于程序员与计算机系统对话中所采用的语言结构和语义划分. 系统结构.组成和实现三者的相互关系: 具有相同系统结构的计算机可以采用不同的组成,一种计算机组成可以采用多种不同的计算机实现: 采用不同的系统结构会使可以采用的组成技术产生差异,计算机组成也会影响系统结构. 计算机系统的设计原则: 哈夫曼压缩原理 Amdahl定律程序访问的局部性规律计算机系统的设计思路: 由上往下(Top-down) 由下往上(Bottom-up) 由中间开始(Middl

计算机系统结构

一.计算机的种类个人计算机 Personal Computer (PC) 工作站 WorkStation (WS) 小型机 Mini Computer 中型机 Mainframe 小巨型机 Minisupercomputer 巨型机 Supercomputer 二.摩尔定律 1.集成电路芯片上所集成的电路的数目,每隔18个月就翻一番. 2.微处理器的性能

【5分钟系列】计算机系统结构的定义

1,计算机系统的层次结构从语言角度来看,一台计算机是由软硬件组合成的,按照功能划分,可以形成多层机器级组成的层次结构. 不同层次的语言,可以使用翻译或解释技术来实现.例如 C# 语言是应用语言,在编译时会生成 IL 语言(高级语言),属于翻译(Translation 美 /tr?nz?le??n,tr?ns?le??n/ ). 在启动程序时,IL 翻译成汇编,由操作系统执行. 不断将高一级的语言转换为低一级的语言. 而解释(Interpretation 美 /?n?t??rpr??te??n/

计算机系统结构1-概论

计算机系统结构-概论考察知识点计算机系统的层次结构计算机系统结构.计算机组成.计算机的实现计算机的软硬件取舍及定量设计原理软件.应用.器件的发展对系统结构的影响系统结构中的并行性开发及计算机系统的分类知识难度: 每个知识点使用 ※ 号标记掌握程度和类型. ※:标识,能够记住知识点和概念: ※※:领会,需要领悟和理解,能够消化和吸收,对知识点做出正确的解释.说明.论述. ※※※:简单应用,能够运用课程中的知识点,例如计算.绘图,去分析.实现和解决一般的应用问题. ※※※※:综合应用,

计算机系统结构总结_Instruction Set Architecture

Textbook:<计算机组成与设计——硬件/软件接口> HI<计算机体系结构——量化研究方法> QR 这节我们来看CPU内部的一些东西. Instruction Set Architecture 指令集是介于硬件(CPU microarchitecture / IO / ....)和软件(compiler / OS / ....)之间的一个interface.硬件(486-586-PentiumPro)和软件(Win98-WinXP)都会更新换代,但指令集很少

计算机系统结构总结_Multiprocessor

Textbook:<计算机组成与设计——硬件/软件接口> HI<计算机体系结构——量化研究方法> QR 最后一节来看看如何实现parallelism 在多处理器系统中,每个处理器(core)可能有自己专属的cache,然后多处理器共享memory.在这种情况下,当多个线程(核心)对同一个变量进行读写时,就会出现不同cache中该变量的值不一样的情况(取决于cache是write back还是write through,以及相关cacheline被evict的时间