专注于互联网--专注于架构

最新标签
网站地图
文章索引
Rss订阅

首页 »博文摘选 » NUMA架构 »正文

NUMA架构

来源: 发布时间:星期六, 2009年12月26日 浏览:0次 评论:0
最近在学习.NET并行计算技术学到个服务器NUMA架构NUMA架构在中大型系统上直非常盛行也是高性能解决方案在系统延迟方面表现都很优秀Windows向都没有在NUMA架构上有多少表现机会AMD多路系统大多也会用在UNIX/Linux上Intel如期进入了NUMA架构怀抱英特尔最新服务器处理器至强5500是项重大结构变革和上代至强处理器相比至强5500采用了非致性存储结构(NUMA)它在块芯片上增加了向内存控制器并行化访问路径增加非统内存访问可以看这篇文章 3款Nehalem至强5500塔式服务器横评对决Windows Server 2003 在线程调度和内存管理器中引入了 NUMA 优化而 Windows Server 2008 在 I/O 管理器中添加了 NUMA 优化同时扩展了内存管理器 NUMA 优化NUMA 系统通常是多处理器系统其中内存延迟随访问它处理器区别而有所区别内存被分成多个节点CPU 和节点的间延迟可能各不相同并且每个 CPU 都被视为它可最快访问那个节点部分Windows 7 和 Windows Server 2008 R2 个重要更新是增强了对多核支持 现已可以支持超过64个逻辑处理器(也就是所谓“核”)并且引入了NUMA 技术 大幅度提高多核运算性能可以说Windows 7/Server 2008 R2已经进入高端企业级市场

传统多核运算是使用SMP(Symmetric Multi-Processor )模式:将多个处理器和个集中存储器和I/O总线相连所有处理器只能访问同个物理存储器因此SMP系统有时也被称为致存储器访问(UMA)结构体系致性意指无论在什么时候处理器只能为内存每个数据保持或共享唯个数值很显然SMP缺点是可伸缩性有限在存储器和I/O接口达到饱和时候增加处理器并不能获得更高性能

NUMA模式是种分布式存储器访问方式处理器可以同时访问区别存储器地址大幅度提高并行性 NUMA模式下处理器被划分成多个"节点"(node) 每个节点被分配有本地存储器空间 所有节点中处理器都可以访问全部系统物理存储器但是访问本节点内存储器所需要时间比访问某些远程节点内存储器所花时间要少得多

NUMA 系统(尤其是具有超过 8个 CPU 系统)通常比致内存访问系统更加经济且性能更高致内存访问系统必须平等地为所有 CPU 提供内存而 NUMA 系统则能够为直接连接到 CPU 内存提供高速互连同时为和 CPU 相隔较远内存提供较为便宜但更高延迟连接

为能在 NUMA 系统中有效扩展操作系统或应用必须了解节点拓扑结构以便使计算能够在包含计算数据和代码内存附近执行例如Windows 调度为每个线程分配个所谓理想处理器该处理器是调度试图始终在其上执行该线程 CPU这样做可以使线程置于 CPU 缓存Cache中数据能够尽可能地在每次该线程运行时可用

NUMA 主要优点是伸缩性NUMA 体系结构在设计上已超越了 SMP 体系结构在伸缩性上限制通过 SMP所有内存访问都传递到相同共享内存总线这种方式非常适用于 CPU 数量相对较少情况但不适用于具有几十个甚至几百个 CPU 情况这些 CPU 会相互竞争对共享内存总线访问NUMA 通过限制任何条内存总线上 CPU 数量并依靠高速互连来连接各个节点从而缓解了这些瓶颈状况

SQL Server 2005开始支持NUMA可参考SQL Server 2008NUMA支持NUMA架构对数据库性能影响可以参考DBA notes同学写NUMA 架构和数据库性能

 

参考资料:

  • Linux NUMA 技术 作者: 自由、创新、研究、探索……
    出处:http://shanyou.cnblogs.com/
    版权:本文版权归作者和博客园共有
    转载:欢迎转载为了保存作者创作热情请按要求【转载】谢谢
    要求:未经作者同意必须保留此段声明;必须在文章中给出原文连接;否则必究法律责任
    个人网站WebSite: http://www.openbeta.cn/


标签:
0

相关文章

读者评论

发表评论

  • 昵称:
  • 内容: