IDF亮点预览:Nehalem处理器最新特性剖析



  Nehalem 3级高速缓存Cache结构

  对于2008年英特尔公司预测他们高端处理器单元销售绝大部分将主要是 4核处理器2009年可能还会延续下去 4核处理器将是英特尔主要销售重点Nehalem处理器也是英特尔首次尝试不过和上代处理器每个处理核心共享L2高速缓存Cache做法区别Nehalem处理器设计和AMD公司巴塞罗那处理器更加类似

2

  这就意味着每个处理器核心都有个小型专用L1和L2高速缓存Cache但是所有处理器核心都共享个共同大型L3高速缓存Cache下面图示是Nehalem处理器高速缓存Cache结构:

  每个核心L1高速缓存Cache(32KB指令和32KB数据)--和英特尔目前核心微体系架构类似

  每个核心L2高速缓存Cache(256KB低延迟)

  L3高速缓存Cache(8MB所有核心共享)--采用独占高速缓存Cache策略

2

  随着Nehalem处理器采用集成内存控制器来直接和内存互联并使用QPI总线技术来加速处理器的间通信英特尔就无需象在使用现有FSB体系架构高端至强处理器(至少使用了12MB L2高速缓存Cache)贯做法那样部署大量高速缓存Cache因此Nehalem处理器每个核心只使用了小型L1和L2高速缓存Cache但是英特尔仍然给处理器分配了大容量8MB L3高速缓存Cache(尽管它只是巴塞罗那处理器L2高速缓存Cache但确是其L3高速缓存Cache速度4倍)L3高速缓存Cache所采用独占高速缓存Cache策略也能确保将探听流量降低到最小化巴塞罗那处理器采用是非独占高速缓存Cache策略

  为了保证模块结构能轻松实现处理器设计和扩展L3高速缓存Cache事实上并非主核心组成部分而是处理器额外构建模块同样核心QPI和集成内存控制器都是组成Nehalem处理器基础设计构建模块以下来自英特尔图示较好阐述了这些构建模块在实现处理器设计时用途并以图例形式对期待中 4核处理器和可能8核处理器进行了对比按照英特尔想法他们甚至有可能在中央处理器中集成个图形核心但是对于这种可能性还没有什么可靠消息或许也等到今年底Nehalem处理器出炉的时才能知晓因此对于将来有可能出现集成图形核心细节确实很有很多值得期待

2

  深度解析Nehalem

  以上已经介绍了Nehalem处理器平台及微体系架构最重要几个部分即英特尔QPI总线技术中央处理器集成DDR3内存控制器和最新 3级高速缓存Cache不过中央处理器处理模块也同等重要Nehalem处理器每个核心都采用4-issue执行引擎设计(首次出现是在Conroe台式机处理器上)在高效性上都有了进提升和改进:

  增强并行计算功能--自英特尔目前多数处理器都采用了乱序执行体系架构以来步增强并行计算能力思路方法的就是增大乱序窗口尺寸来允许执行更多指令尽可能减少延迟使更多并行独立运作成为可能在Core体系架构上并行计算可以同时处理96个微指令(mico-ops)Nehalem处理器将乱序窗口尺寸扩大了33%这样就能同时处理128个微指令同时增加了调度和其他相关缓冲模块来提供支持

  更加高效运算法则--英特尔采用最新微体系架构对其运算法则能加速处理分支预测每个核心新增了 2级分支预测提高了硬件预取能力多线程软件Software中线程同步也有助于性能提升

  增强分支预测--除了用于处理分支预测更为有效运算法则的外Nehalem处理器还能执行 2级分支目标缓存Cache(BTB)对于数据库这样大型代码脚本非常有用 2级分支目标缓存Cache(BTB)不仅能预测分支路径而且能够通过分支对信息进行高速缓存Cache这样能有助于减少性能损耗因此如果发生了预测BTB就能利用其它分支高速缓存Cache信息硬件执行重命名堆栈返回缓存Cache(RSB)能避免指令预测公共回路

  同步多线程(SMT)--英特尔超线程技术正在卷土重来但是这次是作为同步多线程(SMT)横空出世英特尔宣称这是的前技术加强版如果你回想下硬件超线程技术你会发现同步多线程(SMT)就是最新多核心处理器英特尔重申虽然这是同个概念但最优化方面却有所区别当处理器是单核心时采用超级线程技术在未使用处理器注册器上同步执行两个线程能提升处理器性能和有效性当多核处理器面世后我们都知道超线程技术就不再适用了它只能使执行变得更糟

  随着时间推移主要针对多核处理器设计同步多线程拥有了更多缓存Cache更大内存带宽和资源能支持更多应用如今英特尔在Nehalem处理器上将超线程技术老话重提同步多线程(SMT)实现了在每个核心上同步运行所有线程数量翻倍因此首次采用Nehalem微体系架构 4核处理器将具备同步执行8线程能力这也取决于每个核心资源实用性同步多线程技术能将应用软件Software性能提升20%到30%能量消耗也会有轻微上扬因此应用软件Software和工作负载使用越多线程就能获取更佳性能

  英特尔SSE4.2指令集--这并非新SSE标准而是英特尔公司除了SSE4支持外为最新应用软件Software目标加速器定义指令集SSE4指令集所提供支持和Penryn处理器是但是英特尔在Nehalem处理器中增加了 7个最新应用软件Software目标加速器来提升体系架构加速串和文本处理(诸如XML)处理能力SSE4.2指令集对XML无论是在应用软件Software还是在数据库中应用都对其性能提升有所帮助

  改进虚拟化性能--自从Nehalem处理器首次在服务器和工作站领域亮相以来英特尔公司对Nehalem处理器在虚拟化环境中性能提升也做出了努力Nehalem处理器将是首个支持英特尔扩展页面表(Extended Page TableEPT)特点服务器EPT也是英特尔NestedPaging特点个版本AMD公司第 2代和第 3代皓龙处理器也有这个特性

Tags: 

延伸阅读

最新评论

发表评论