NV Maxwell architecture

按照NVIDIA的路线图来看,GTX 600以及GTX 700系列所采用的Kepler架构已经垂垂老矣,最早在明年第一季度,其继任者Maxwell架构可能就会和我们正式见面了。目前外媒已经放出了关于Maxwell的架构规格,但还无法确定是否为真。

根据WCCFTech的报道,Maxwell架构依然采用来自台积电的28nm制造工艺,而NVIDIA计划推出四款Maxwell芯片,分别是GM104、GM106、GM108和GM100,相对目前的Kepler来说,Maxwell最为明显的特性就是CUDA核心会有爆发性的提升,而深层次的改变则是增强SMX单元设计并优化双精度逻辑单元。

具体来说,Maxwell的每个SMX单元将会拥有256个CUDA核心,而目前Kepler架构中这一数字为192个,当然由于DP单元和纹理单元数量保持不变,所以DP双精度浮点单元的比例会从Kepler的1:3降低到1:4。当然Maxwell依然会延续Kepler中DP双精度浮点单元可关闭的特性,从而降低功耗。

除了数量上的变化之外,Maxwell魅族SMX单元会的寄存器数量会增加两个,L1缓存会从64kb增加到128kb,而且可以32/96、64/64、96/32的比列来分配成缓存和共享内存。另外每个GPC单元中还会有768kb的L2缓存作为指令集缓存。


GPU架构路线图

下面来看看具体的核心:

GM108:

GM108拥有576个CUDA核心,48个纹理单元,8个光栅单元,显存位宽为64bit,核心面积则和当年的GF117差不多,显然是低端入门级产品。

据说在GM108之前还有一个GM107,但尚不能确定具体规格。

GM106:

GM106自然是要取代目前的GK106了,定位中端,具体取代的产品是GTX 650Ti以及GTX 660家族。

GM106的CUDA核心数量从GK106的960个暴涨到2304个,拥有144个纹理单元,24个光栅单元,显存位宽为192bit,容量为3GB,等效显存频率能够达到7GHz左右。

GM104:

从命名上看他显然是为了接替目前的GK104核心,也就说定位中高端。

CM104拥有5组GPC单元(GK104为4组),共计3840个CUDA核心、240个纹理单元以及40个光栅单元,位宽为320bit,容量为3GB,也有可能是2.5GB。核心频率可能会在1GHz左右,等效显存频率能够达到7GHz左右。

GM100:

GM100是完整的Maxwell架构,共计有8个GPC单元,每个GPC单元有三组SMX单元,总计之后拥有6144个CUDA核心,384个纹理单元以及64个光栅单元,显存位宽512bit,容量更是达到了夸张的8GB。

具体频率方面,GeForce系列的GM100核心频率为930MHz左右,加速频率为1GHz左右,而Tesla中的GM100核心频率为850MHz左右,双精度浮点性能为2.61TFLOPS,达到目前GTX TITAN的两倍。

如果Maxwell架构真的和文中说的这么强大的话,那么下一代的NVIDIA显卡的性能确实值得我们期待,AMD会拿什么来抵挡呢?

NV Maxwell architecture

时间: 2024-08-08 03:31:08

NV Maxwell architecture的相关文章

Tesla-> Fermi (550Ti) -> Kepler(680) -> Maxwell (750Ti) -> Volta(was Pascal)

Pascal GPU Pascal (from French mathematician Blaise Pascal) is Maxwell successor. In this news, we learnt that Volta was the post-Maxwell architecture, but it seems that Pascal is the new official name. One of the main feature of the Pascal architect

NVlink

Nvidia's Pascal to use stacked memory, proprietary NVLink interconnect by Scott Wasson — 6:50 PM on March 25, 2014 GTC — Today during his opening keynote at the Nvidia GPU Technology Conference, CEO Jen-Hsun Huang offered an update to Nvidia's GPU ro

Nvidia 的新显卡架构 Maxwell 性能相比开普勒提升了多少?

作者:喵西和熊链接:https://www.zhihu.com/question/22630075/answer/29041618来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 现在Nvidia的节奏基本上是一个结构用两年.类似于intel的钟摆计划.我们先先谈谈开普勒架构之前的费米架构好了.费米的本质是什么,英伟达只要用他来搞通用计算的还有DX11(这个涉及当年的环境问题).费米架构提出了GPC和SM的结构概念.每一个GPC则有4个SM,sm里面有32个CUDA

App 组件化/模块化之路——Android 框架组件(Android Architecture Components)使用指南

面对越来越复杂的 App 需求,Google 官方发布了Android 框架组件库(Android Architecture Components ).为开发者更好的开发 App 提供了非常好的样本.这个框架里的组件是配合 Android 组件生命周期的,所以它能够很好的规避组件生命周期管理的问题.今天我们就来看看这个库的使用. 通用的框架准则 官方建议在架构 App 的时候遵循以下两个准则: 关注分离 其中早期开发 App 最常见的做法是在 Activity 或者 Fragment 中写了大量

微服务架构(Microservice Architecture)

之前一段时间,有听部门架构说起接下来公司要使用微服务架构来研发系统,当时没怎么在意,因为是第一次听说微服务这个名词(果然无知者无畏啊):正好赶上五一假, 我自告奋勇的,接了编写微服务架构培训文档这个任务(也许因为我是文科生,文笔稍微好点).五一假期三天,基本都是在看资料,梳理思路以及编写接下来的培训文档中度过. 下面,就说说我这几天的一些收获吧:先说说资料来源吧:有架构给我的一些资料,以及自己百度和论坛.社区找来的一些资料,权当做一个总结式的简介... 目录如下: 一.微服务架构介绍 二.出现和

坑爹的 ld: symbol(s) not found for architecture armv7

前两天好好的程序在Xcode 8 4s(8.4)真机的时候遇到上图错误,但是在5s.6s上都能正常运行,第一反应百度--然后根据百度经验: 如果真机调试就是 undefined symbols for architecture armv7错误! 发生这种错误通常是project.pbxproj这个文件引起的,尤其在多人合作开发的时候,svn提交不规范可能导致project.pbxproj发生错误,导致文件的引用不在project.pbxproj文件中. xcode项目import文件会根据pro

(转) Deep learning architecture diagrams

FastML Machine learning made easy RSS Home Contents Popular Links Backgrounds About Deep learning architecture diagrams 2016-09-30 Like a wild stream after a wet season in African savanna diverges into many smaller streams forming lakes and puddles,

SOA EDA 事件驱动架构 (Event-Driven Architecture,EDA) 简介

事件驱动架构 (Event-Driven Architecture,EDA) 简介 可以从两个方面来理解 EDA: EDA 是一种侧重于以生成/消费为基础的异步通信的架构模式.这主要对照于传统的基于线程的同步系统. EDA 是一种以事件 (event)为核心,提供事件产生,路由,消费已经结果回调等机制的架构模式. 简单地说, 面向服务架构 (Service-Oriented Architecture, SOA) 是一种 IT 架构策略,其基于面向服务的概念之上.自从 2002 开始为大家熟知以来

Building Maintainable Software-java篇之Keep Architecture Components Balanced

Building encapsulation boundaries is a crucial skill in software architecture. -George H. Fairbanks in Just Enough Architecture Guideline: ? Balance the number and relative size of top-level components in your code. ? Do this by organizing source cod