深入分析:AMD Quad FX 终显强悍本色! | ||||||
---|---|---|---|---|---|---|
http://www.sina.com.cn 2006年12月13日 13:38 IT168.com | ||||||
【IT168 资讯】关于AMD QuadFX的一些比较简单的问题都已经有了答案,但真正关键的问题是:用户为什么要买它?用它能做什么?国外网站INQ对此进行了探讨,原文地址。 至少可以说,这些机器有点贵,推荐配置轻而易举地超过3000 美元。该系列中低端的 FX-70售价为 599 美元,如果有更便宜的型号出现的话,也许花1500 美元就可配一台电脑,但还是比较贵。所以, Quad FX处理器定位于高端发烧友市场。 同样在争夺发烧友市场的其他四核处理器还有英特尔的核心代号为Kentsfield的处理器,其价格与 QuadFX相同,在整体系统成本上也势均力敌。这会使得它们在市场上短兵相接。是这样吗? 不完全是这样,它们瞄向的是不同的工作负载。由于架构原因,这两个平台在特定的方面各有所长。除了四核和不菲的价格外,它们在架构上没有多少相似之处。Kentsfield 是游戏玩家的利器,QuadFX则面向多任务工作站。毫无疑问,它们两个都能轻松击败Best Buy零售店带集成显卡的特别推荐产品。 无论如何评价,它们两个都是不错的产品,它们都在某些领域里将对方远远地抛在身后,这就是所谓的各有所长。机器的性能要由整体架构而不是系统中的任何单一部件决定。 如果您看一下 AMD Quad FX的系统图表,将会看到大量的“双”连接:双CPU插槽、双个内存通道、双独立的芯片组通道。其绝大部分组件都和Kentsfield相同,RAM和GPU所有外围设备一样通用,但组件连接方式就不相同了。
Kentsfield 更接近传统架构,唯一特殊的部分是一个CPU里有两个硅片。它没有使用两个插槽,而是将两个Conroe拼在了一起,虽然相互隔开,但它们都连接到同一个频率为1333MHz前端总线。它还有一个内存控制器,仅有一个北桥芯片。 从系统的角度来看,这产生了一套有趣的折衷。我不认为任何人能够辩称Core 2 Duo芯片比FX-7x核心慢。事实上,它会赢得大多数主要单线程应用基准测试。这对游戏很重要,由于绝大多数游戏都是单线程的,极少有多线程的情况,所以,Kentsfield是游戏玩家的上选。 如果游戏是CPU密集性,那么,英特尔处理器将以IPC、高时钟率和高缓存容量获胜。但如果游戏受制于CPU之外的其它部件,比如 GPU、IO、或内存,则AMD QuadFX就将开始显示它的威力。如果使用英特尔CPU,所有数据流量、内存、GPU、IO 和信号就都必须流入同一个FSB。 1333MHz FSB并不差,能够胜任为两个CPU和一个高端图形卡提供服务。但加入第二个GPU、高端声卡、一个10K Raptor硬盘阵列,它应付起来就有些吃力了。再加上两个核心,运行一个完全使用了这些东西的程序,您就会陷入竞争的漩涡。 FSB 基本上是一个瓶颈。在AMD方面,它拥有两倍的内存带宽,两倍的北桥带宽、而且内存带宽在很大程度上独立于 I/O 流量。在负载沉重的机器上,AMD可以利用更多的CPU可用能力。 英特尔使用巨大的缓存来弥补这一缺陷,并且取得了一些效果,但是,从某种程度上说,这是掩盖而不是解决问题。2008 年第四季度,随着称作CSI(Common System Interface,通用系统接口) 的Nehalem的推出,问题才会得到解决。直到那时,AMD 都会在平台带宽方面独领风骚。 对AMD来说还要考虑到延迟问题。英特尔只有一条到单一内存控制器的通道:FSB。这使得内存可以拥有很好的预测时间,延迟变化非常小。而如果使用AMD皓龙,则QuadFX板有两个由超传输总线连接的控制器。如果 CPU1或2 需要一个位于其本地内存上的字节,它们可以直接拿到。如果它们需要位于另一个插槽上的内存,它们就不得不跨越HT,这时就会发生延迟。 那么,英特尔每次都能赢,对吗?也不是这样。这是因为 AMD拥有两倍可资利用的内存带宽。任何有关谁将获胜的问题都要取决于一系列的条件,CPU 能力、IO、磁盘、内存延迟、内存带宽和太阳耀斑都会提高速度或者导致故障。 如果您的应用能够充分利用英特尔的长处,Kentsfield会打败AMD。游戏和较老的单线程应用都是很好的示例,在 2007 年的大多数时间里,它们都将是主要的软件类型。如果您有需要大量内存访问的工作,或者您的游戏实际能够有效利用多个内核,那么,AMD将战胜英特尔。它取决于您使用什么软件,您如何使用这些软件。 绝大多数人都把QuadFX和Kentsfield机器当成简单的游戏机来比较,这是错误的。您可以这么做,这在技术上没有错误,但是,这不是AMD承诺这台机器的东西。自从它首次发布以来,人们就假定它是杀手级的游戏装备,而这并不是实际情况。 自从夏天初次登场亮相,AMD 就明确表明QuadFX的意义在于在单一机器上同时完成更多工作,他们使用了术语“海量多任务”。从基本上讲,AMD 架构更适合于同时处理很多不同任务。它不存在影响所有数据流动的单一瓶颈,所以,一个内核可以利用系统的很多部件,而不会与其它内核相互冲突。 而不利的一面是:他们的单线程速度不如 Kentsfield 内核,如果应用不需要所有这些带宽,则其性能落后。所有这些产生的结果是:增加的插槽带来了很多优势,如额外的核心、增加的带宽,但同时也产生了一些问题:主要是延迟。这些问题有可能完全不值一提。也可能会产生巨大影响、也可能介于二者之间,这取决于您的应用。在绝大多数情况下,应介于二者之间,我们暂且有根据地估计,AMD QuadFX总体优势将相当可观。 展示系统带宽的好方法是运行一些很简单的综合基准测试:Sisoft Sandra 和Sciencemark。由于 XP 处理NUMA (非一致内存访问)的方式很糟,我们选择了Windows Vista RC2 作为平台。系统的其余部分是:FX-74、4 GB 的 Corsair Dominator 内存、和 WD 500GB 硬盘。显卡为Nvidia 7900,不过与CPU和内存综合得分完全无关。 我正在寻求不让QuadFX和 Kentsfield比较,也不和旧的FX比较,而是和不带有第二个CPU的自己比较。增加第二个 CPU 会对系统整体有多少帮助或者损害?理论上,第二个CPU会增加带宽和延迟,前一项有正面作用,后一项则有负面作用。 第一套数据来自于在Vista RC2中运行的Sisoft Sandra 64位版本。您可以看到,下方的红线显示综合内存带宽,上方的是整数运算,下方的是浮点运算。中间栏是比较芯片,单双运行之间没有可比性,忽略它们。 上方的一套是系统中仅有单一FX-74时的情况,下方的则是两个。您可以清楚地看到,可用带宽从 8209/8235 上升为 14416/14403,提高了约 76%。这是一个相当不错的合计变化比例,它显示出,如果您希望更高的内存带宽,那么配备第二个FX芯片就很合适。
同时, Sciencemark也显示出延迟,由于Sciencemark站点在测试期间关闭(更新:使用德国站点并从欧洲镜像下载),我不得不使用较旧的32位版本,但它仍然清晰地显示出延迟问题。 上方的数据的是单插槽FX-74,下方的则是使用了第二个插槽后的情况。在最好情况下,延迟没有变化,但是五项测试中的四个都显示出从3至最高46个时钟周期的负面变化,这会降低几乎25% 的速度。
增加的插槽带来了很多优势:额外的核心、增加的带宽,但同时也产生了一些问题:主要是延迟。根据您的应用不同,这些问题有可能完全不值一提,也可能会产生巨大影响,也可能介于二者之间。在绝大多数情况下,应介于二者之间,我暂且认为,其总体优势将相当可观。 而对于单线程游戏来说,它将不会有太大帮助。回过头看,这也正如AMD所说,您拥有了一台能够同时做好很多工作的计算机。 在我看来,如果您现在让QuadFX和Kentsfield对决,则绝大多数游戏都只是单线程的,而流行的操作系统XP在NUMA优化和在内核间传输数据方面也表现糟糕。如果您仅需处理静态的工作负载,使用 Kentsfield 即可。 如果您计划运行Vista,将计算机用作日常工作站,趁老板不在的时候运行网络游戏,则QuadFX就开始越来越被看好了。您的工作越多,其效果就越佳。现在,我通过两个高分辨率显示器,在系统进程中打开了 19 个窗口,并运行10个程序。其中没有特别密集型的应用,但是,却有些程序使系统不时地疲于奔命。 这意味着,工作负载即将从对英特尔有利的使用尖峰型转向对AMD有利的更加均衡的类型。平均工作负载也正从英特尔的世界观转为现在的AMD 世界观。如果您还在考虑 2007 年中期向双四核的升级,那么,使用 QFX 更为有利。 |