揭露比武真相 4200+实战PK E6300 | |
---|---|
http://www.sina.com.cn 2006年08月25日 11:35 eNet硅谷动力 | |
作者:午夜失眠 日前,AMD在日本最著名的电子市场进行了与英特尔处理器性能和功耗对比。参加对比的两位主角是AMD的Athlon 64 X2 4200+(Socket AM2)和Intel进来风头正劲的Core 2 Duo E6300。AMD举行这样一个活动,无疑是为了增加自家的双核处理器Athlon 64 X2在和Intel近期大力推行的Core 2 Duo处理器的竞争力,最重要的是使众多消费者形成一种观念,那就是Athlon 64 X2与Core 2 Duo相比,无论是在功耗和性能上都要占优势。 从日本国内的网站可以看到这次活动的详细报道。从网站的报道可以得知,这次测试使用的是平台分别是Athlon 64 x 2 4200+搭配华硕M2N32-SLI Deluxe,Core 2 Duo E6300则是搭配华硕P5W DH Deluxe,其他配件则是相同的。 这次“比武”的性能比拼项目总共有五项,X2 4200+赢得了其中三项,E6300则胜了两项。从这个结果,我们确实如AMD所愿,得到这样一种结论,Athlon 64 X2比Core 2 Duo E6300要优秀!但是细心的用户也许可以发现,X2 4200+占优的项目领先的幅度都较小,而E6300占优的项目领先的幅度要明显不少。此外,笔者也不禁想,即便这几个项目X2 4200+都取得领先,那E6300是不是就真的一败涂地呢?因为在笔者眼中,E6300的性能总体而言,是要比X2 4200+高一些的。为了验证自己的想法,笔者特意找来和AMD当日测试平台相同的CPU和主板,进行了详尽的测试,但在测试之前,先来了解一下目前AMD和Intel两大厂商在主流双核处理器产品的一些情况。 AMD Athlon 64 X2处理器概述 Socket AM2处理器是AMD在五月份发布的全新接口的产品。AMD选择了DDR2市场成熟、Core 2 Duo发布的之前把处理器接口统一到Socket AM2,可以看做是一次借助技术升级进行的市场策略重整。AM2的过渡也宣布AMD全面进入了DDR2的时代,接口统一之后的AMD处理器依然依照不同的市场定位分为了Athlon64 FX、Athlon64 X2、Athlon64、Sempron64四个系列。全部支持DDR2双通道,不过只有FX和X2支持DDR2 800,Athlon64和Sempron64则最高只支持DDR2 667。目前来说DDR2的优势已经是非常明显,不止DDR2的功耗更低,高频率也带来了更大的内存带宽,系统性能得到提高。 AMD的Socket AM2接口的Athlon 64 X2双核心处理器采用和Socket 939接口的X2处理器一样的封装模式,即在X2内部仅有一片硅晶圆,上面同时达载着两个内核,是一种比Intel Pentium D处理器更先进的多核心处理器架构。单个芯片双核心的好处就是,两个核心距离更近,彼此数据交换速度也更快,并且延时较低,发热量也比较少。 过渡到AM2接口后,AMD全线处理器的PR值都有改变,Athlon64 X2系列也首次出现了5000+这个型号。4200+则是处于X2处理器的下游,其下还有3800+和最近才发布的3600+两个型号。 按照AMD原来的产品规格表,可以看到原定计划中,AMD还会推出2×1MB二级缓存的4400+和4800+,和4200+和4600+只是二级缓存容量的不同,其他规格则是一样的。但在近期的市场上我们还没有看到有2× 1MB缓存的X2处理器出售。同时除了最低3800+和最高的5000+之外,其他各个型号都有两种不同的TDP设计,据悉低功耗版将会比同型号的贵10~30美元。虽然AMD的产品仍然在使用90纳米制程,但功耗的优化做得却相当出色。 除了功耗方面控制得更好,Socket AM2相对于Socket 939处理器改进的地方还有内存控制器的改变,由上代支持Dual Channel DDR400提升为Dual Channel DDR2 800,另外还加入AMD Virtualzation Technology,它的用处类似Intel的VT功能,有效提高系统运作虚拟多作业系统下的性能、可靠度及保安性,除此之外,核心的主要架构及规格并没有作出任何改良,也意味著Socket AM2版本的Athlon64 FX、Athlon64 X2及Athlon64与Socket 939相比,但相同频率下并不会出现很明显的性能增长。 Intel Core 2 Duo处理器概述 踏入06下半年,采用Core微架构的处理器即将要公开发售。这次架构的改变也统一在移动处理器、桌面处理器和服务器处理器进行,分别有面对笔记本市场的移动处理器Merom,面向桌面处理器的Conroe和服务器领域的Woodcrest。 Core微架构产品推出后,Intel处理器也会全面进入双核时代,名称更换为Croe 2以作为对上一代移动处理器Core Duo/Solo的识别,桌面处理器将会有面对中高端市场的Core 2 Duo和旗舰级的Core 2 Extreme。首先要推出桌面处理器开头前缀是E6000系列,由1.86GHz起跳的E6300、2.13GHz的E6400,更高端的有E6600和E6700频率为2.4GHz和2.67GHz,旗舰级的Core 2 eXteme X6800频率将达到2.93GHz。前端总线频率全部为1066MHz,而由于P965系列芯片组只支持到1066Mhz的前端总线,预计1333MHz前端总线的Conroe最早只能在2007年才发布。这次要测试的则是目前Core 2 Duo处理器中最低端的一款,型号为E6300,主频为1.86GHz,具有2MB二级缓存和1066MHz前端总线,核心代号为Allendale。 相比Intel上一代NetBurst架构,Core微架构有了革命性的变化,这变化并不是由NetBurst衍生出来的,根据Intel官方的说法,Core微架构综合了Pentium M(Banias、Tualatin等)和Netburst的优点。从Core微架构的一系列的变化我们可以看到Intel已经跳出了追求频率的怪圈,执行效率、运行功耗等成为首要解决的问题。 以往NetBurst架构的P4处理器为追求高频率而采用了更深的指令执行流水线设计,Williamette和NorthWood等拥有20级、Prescott核心则更达到31级,而AMD K8架构等拥有17级。更长的流水线会让频率得到更高的提升,但负面影响是一旦产生分支预测失败或缓冲区为命中的时间后将会浪费更多的时钟周期,虽然频率提升可以弥补这方面的缺陷,但是以现在所能达到的频率显然是不足以弥补这种性能损失。因此Core微架构设计了14级的指令执行流水线,更短的流水线也会让指令的处理速度更快,目前看来这是一种兼顾了效能和速度的解决方法。 而在这次CPU微架构的变革中,出了流水线架构的改变,另外五大创新技术的引入成为Core 2 Duo处理器性能大幅提升的主要因素,这五项创新技术就是宽区动态执行、智能功率能力、高级智能高速缓存、智能内存访问、高级数字媒体增强。其中宽区动态执行、高级智能高速缓存、智能内存访问是最为重要的三项。 宽区动态执行(Intel Wide Dynamic Execution) 当今衡量一款处理器的性能水平,已经不能再单纯的以频率的高低考量,而是更强调“每瓦特性能”,也就是所谓的能效比。“性能=频率×每个时钟周期的指令数”是英特尔提出的对性能的创新理解,英特尔宽位动态执行通过提升每个时钟周期完成的指令数,从而显著改进执行能力。 英特尔酷睿微架构拥有4组解码单元,相比上代Pentium Pro (P6) / Pentium II / Pentium III / Pentium M架构拥有3组可多处理一组指令。所谓四组解码单元,就是指能够在单一频率周期内编译四个x86指令。这四组解码单元由三组简单解码单元(Simple Decoder)与一组复杂解码单元(Complex Decoder)组成。简单讲,每个执行内核将变得更加宽阔,这样它们就可以同时获取、分配、执行和返回达4条完整的指令。带有2个内核的单枚多核处理器就可以同时获取、分配、执行和返回8条指令。 英特尔Core微架构在提升每个时钟周期的指令数方面做了很多努力,例如新加入宏融合(Macro-Fusion)技术,它可以让处理器在解码的同时,将同类的指令融合为单一的指令,这样可以减少处理的指令总数,让处理器在更短的时间内处理更多的指令。为此英特尔酷睿微体系结构也改良了ALU(算术逻辑单元)以支持宏融合技术。 Intel 的宏指令融合技术在AMD的K8处理器(包括Socket 939和AM2)上并不存在,不过AMD拥有与微指令融合技术类似的技术。在 Athlon 处理器中,也存在有微指令融合技术。例如,一条 ADD [mem], EAX 指令在真正执行前中始终保持为一条指令。因此,它在缓冲区中也只会占据1个单元的空间。不过,在 Core 微架构中 load 操作和 SSE 操作等也可以被融合,而 K8 处理器则不行,它会把SSE操作解码成2条宏指令。 微指令融合技术的目的就在于减少微指令的数目。处理器内部执行单元的资源有限,如果可以减少微指令的数目,就代表实际执行的X86指令增加了,可以显著提升执行效能。而且,微指令的数目减少还有助于降低处理器功耗,可谓有益无害。 因此而言,Core 微架构要更具有优势。在一般情况下,它每个时钟周期可以解码4条X86指令,加上宏指令融合技术的话则最多可以解码5条X86指令。而 AMD 的 K8 处理器每个时钟周期只能解码3条。仅当多条复杂指令同时需要复杂解码单元进行解码的时候,K8 处理器的解码单元会胜过 Core 微架构的解码单元。但是考虑到实际程序中的绝大多数X86指令对应简单解码单元的事实,这种情况不大可能发生。 高级智能高速缓存(Intel Advanced Smart Cache) 以往双核的无论是Intel的Pentium D系列还是AMD的Athlon 64 X2都是独立的二级缓存,核心之间数据只能通过系统总线来交换,这无疑占用了总线带宽和带来延迟,不利于核心之间的密切合作。当系统只需要其中一枚内核进行运算时,另外一枚内核将会处于闲置状态,而闲置内核就意味着闲置二级高速缓存。尤其是当另外的内核由于二级高速缓存负载过满而承受巨大性能压力的时候,这将是一种巨大的资源浪费。而Conroe拥有和Yonah一样的共享二级缓存,通过内部的Shared Bus Router共用L2 Cache脱离了对系统总线的依赖。共享智能缓存的设计也使得功耗和性能之间达到很好的平衡。在不同强度的运算强度下,Core微架构可以关闭其中一个核心而另外一个核心使用全部的二级缓存,以减少高速缓存错误并提高性能,而当不需要时也能够关闭部分的缓存单元以节约能源。这样可以降低二级缓存的命中失误,减少数据延迟,改进处理器效率,增加绝对性能和每瓦特性能,由此带来的强大性能是采用独立二级缓存设计的Athlon 64 X2所不能企及的。 智能内存访问(Intel Smart Memory Access) 智能内存访问是另一个能够提高系统性能的特性,通过缩短内存延迟来优化内存数据访问。智能内存访问技术能够预测系统的需要,从而提前载入或预取数据,反映到用户的直接使用体验上,就是大幅提高了执行程序的效率。 智能内存访问技术主要包括内存消歧(Memory Disambiguation)和增强的预取器(Advanced Prefetchers)。内存消歧提高了乱序处理的效率,因为它可以为执行内核提供内建的智能,以帮助其在执行完所有预先存储的指令前,预测性地载入指令即将需要执行的数据。经过内存消歧后,分别设置在一级缓存和二级缓存的预取器就会先将需要的数据载入到缓存中。为了让数据位于每个执行内核所需要的地方,英特尔酷睿微体系结构为每个一级高速缓存和二级高速缓存均配置了两个预取器。这些预取器同时检测多个数据流和大跨度的存取类型。这样它们便可以在一级高速缓存中“及时”准备待执行的数据。二级高速缓存的预取器可以分析内核的访问情况,以确保二级高速缓存拥有未来可能需要的数据。这两个技术配合能够最大化的使用总线带宽,减少突发性的数据交换造成堵塞。 大致了解了目前两大厂商的双核处理器的情况之后,我们再来看一下整个对比测试平台的情况,具体如下: CPU:AMD Athlon 64 X2 4200+(2.2GHz,2×512KB L2) Intel Core 2 Duo E6300(1.86GHz,2MB L2) 主板:华硕 M2N32-SLI Deluxe(nForce 590 SLI) 华硕 P5W DH Deluxe(i975X + ICH7) 内存:2048MB DDR2-800 SDRAM (ADATA DDR2-800, 2 x 1024 MB, 5-5-5-18) 显卡:X1900 XTX 512MB 硬盘:希捷 7200.10 320GB,16MB缓存 AMD平台的顶级之作——华硕M2N32-SLI Deluxe,采用nVIDIA目前最顶级的nForce 590 SLI芯片组,支持AMD全系列Socket AM2处理器,最高支持8GB DDR2内存。 E6300搭配的主板采用的同样是华硕在Intel平台的顶级产品P5W DH Deluxe,采用Intel 975X+ICH7R芯片组,支持包括Core 2 Duo/Extreme在内的全系列LGA 775处理器,同样最高支持8GB DDR2内存。 两个平台采用的主板都和当日AMD在日本设下的“比武擂台”所采用的主板相同,其他配件虽然不同,但仍然采用了相同等级的产品,对测试成绩的影响较小。此外,在测试时,两个平台的参数都全部采用了默认设置,并关闭自动超频,以保持测试的公正性。以下是两款参加测试的CPU的CPU-Z截图,可以从图中看到两款产品的详细规格。 Athlon 64 X2 4200+,Windsor核心,F2步进,外频200MHz,倍频11x,主频为2.2GHz,双核心架构,每个核心具有64KB一级数据缓存、64KB一级指令缓存和512KB二级缓存。因为X2双核心处理器为独立二级缓存设计,因此在CPU-Z截图中看到的是2×512KB的二级缓存设计。X2 4200+处理器的一级缓存采用两路联合设计,二级缓存则采用16路联合设计。 Intel Core 2 Duo E6300,Allendale核心,B2步进,外频266MHz,倍频7x,主频为1.86GHz,双核心架构,每个核心拥有32KB一级数据缓存和32KB一级指令缓存,二级缓存总容量为2MB。由于Core 2 Duo处理器采用共享二级缓存设计,因此在这个截图中看到的二级缓存容量是2MB×1的设计,而非1MB×2。Core 2 Duo E6300的一级缓存采用了8路联合设计,二级缓存则采用了8路联合设计,缓存容量更大的E6600以上级别的Core 2处理器二级缓存采用16路联合设计。 接下来,我们看详细的测试成绩对比。 Super PI是一个计算圆周率的小程序,支持计算到小数点之后3200万位。由于它超强的计算功能,很多人利用它的计算速度来衡量CPU的计算性能,以及CPU的稳定性。而Super PI Mod是在原版基础上制作的修改版,时间统计精确到毫秒级。在Core 2 Duo处理器面世之前,AMD的处理器一直凭借较高的浮点运算能力在这个测试中占有优势,但在Core 2 Duo处理器面试之后,得益于更高效的微架构,Core 2 Duo处理器拥有非常强大的浮点运算能力,AMD也在这一测试中全面大幅度落后。不过需要说明的是,在单线程应用中,基于共享L2缓存架构的Core可以调用所有的L2缓存,而Athlon 64 X2和Pentium D处理器内核所能使用的L2缓存容量仅仅是总容量的一半。X2 4200+和E6300在这个测试中,E6300取得了20-30%的领先幅度,差距十分明显。 SiSoftWare Sandra是一套功能强大的系统分析评测工具,拥有超过30种以上的测试项目,主要包括有CPU、Drives、CD-ROM/DVD、Memory、SCSI、APM/ACPI、鼠标、键盘、网络、主板、打印机等,全面支持当前各种芯片组和AMD、Intel平台。SiSoftWare Sandra 2007是这个软件目前的最新版本。在Processor Arithmetic测试的两项成绩中,X2 4200+在Whetstone 3项目中领先,E6300则在Dhrystone ALU项目中占优势,但两者差距都不明显。但在测试CPU多媒体运算能力的Processor Multi-Media测试中,无论是整数运算还是浮点运算,E6300都大幅领先X2 4200+,其中整数运算能力更是接近X2 4200+的2.5倍!最后在内存带宽测试上面,凭借内部集成内存控制器的优势,X2 4200+在这一测试中取得了较大幅度的领先,领先幅度在20%左右。 CineBench 9.5是用于测试CPU在多任务环境下应用的一个软件,其中前两项测试是分别基于单核心和多核心的测试,后面三项是系统显卡性能的测试。从这个测试中,我们可以看到X2 4200+以微弱的优势在CPU性能测试项目中取得领先,而在图形性能测试项目中则互有优劣。 Sysmark 2004 SE是BAPCO出品的权威性测试软件,它通过对一些常用软件进行实际使用,从而比较真实的反映出系统性能。因此这款软件的测试结果在日常应用中极具参考价值。SYSMark 2004 SE由两部分组成:Internet Content Creation和Office Productivity。SYSMark 2004 SE的测试成绩一共产生6组测试结果,Internet Content Creation和Office Productivity各产生三组,最后根据两个部分的分数整合成为总分。这款工具可以在不同负载的工作模式下将复杂系统的性能充分展示出来。 从这个测试的成绩来看,无论是在数字内容编译及处理测试中(前三项),还是在在办公室应用程序测试中(后三项),以E6300搭建的系统都领先于X2 4200+系统,E6300的性能优势十分明显。 3ds MAX 7.0是个著名的3D制作软件,可以用于测试CPU的运算能力。这个测试中,E6300以10%左右的成绩领先于X2 4200。 在音频和视频编码测试中,除了MPEG-4编码测试是以FPS作为测试成绩之外,得分越高性能越强,而另外三个测试都是以完成测试的时间作为测试成绩,单位为秒,完成测试的时间越短越好。从测试成绩可以看到,除了MP3编码中X2 4200以1秒的成绩领先之外,其他三项测试中E6300都取得了优势。但总体而言,在这个测试中两者的性能差距并不十分明显,可以说E6300和X2 4200+在音频和视频编码应用方面性能处于同一水平。 在图像和视频编辑中,两项测试的成绩都是以完成测试的时间计算,单位为秒,时间越短性能越强。在这一测试中同样看到和音频、视频编码压缩测试中的情况,E6300以微弱的优势领先于X2 4200+,但差距只是2%左右,在实际应用中几乎可以忽略。 3DMark 06测试,除了测试系统的图形性能之外,还可以测试CPU的处理能力。在这个测试中,X2 4200+取得了一定优势,但是差距也只是2-3%,很微弱的差距。 一直以来,AMD的Athlon 64处理器无疑是最佳的游戏处理器,它所领先的优势是Pentium 4和Pentium D处理器所无法动摇的。 而现在一切都发生了戏剧性的变化。新一代Core 2 Duo 处理器已经取代了Athlon 64成为了最强的游戏处理器。从测试的4个游戏中,我们可以看到E6300都取得了领先,其中在FarCry测试中更是取得了超过10祯的优势,Intel处理器在游戏性能方面的劣势已经已去不返了。 功耗测试: 高功耗一直是英特尔上代一双核心处理器的最大缺陷,因此英特尔工程师们在开发Core微处理器架构中在功耗控制方面下了不少的心思。Core微架构的电源管理机制基本上改良自Pentium M与Yonah的设计。处理器内各功能单元并非随时保持启动状态,可根据预测机制,仅启动需要的功能单元,这点与Pentium M/Yonah相同。同时Core微架构导入分离式总线,仅有遇到特殊状况时,才会启动全部的总线宽度,平时仅启动一半的宽度,以节约电力。由内而外,Core微架构分别针对处理器热量侦测、动态系统电压调整,以及调整系统风扇转速,提供对应的功能。如同Yonah,Core微架构在处理器数个最容易发热的位置,放置数字热量传感器,通过专属的控制电路,监控处理器的发热量以及运作模式。 同时英特尔还引入了“性能/每瓦特”的概念,以期充分体现Core架构功耗控制方面的先进性。因此,我们一直期望Core处理器有着不错的表现,这也是今天我们引入功耗测试的目的。 在功耗测试中,笔者使用S&M utility这款工具来测试处理器的最大功耗。在测试的时候,首先测试一个处理器在空闲情况下的功耗,然后再测试处理器在全速运行是的功耗。在这个测试中,AMD Cool'n'Quiet 和Intel Enhanced SpeedStep功能都将关闭。 从测试得到的数据看到,无论是在空闲状态还是全速运行状态,E6300的功耗都控制得非常出色,X2 4200+的功耗则要高出很多,尤其是在全速状态之下,X2 4200+的功耗高达87W,达到了E6300的两倍!不过这应该是因为笔者测试的这颗X2 4200+的TDP为89W有关,如果采用TDP为65W的X2 4200+,功耗应该控制得要好很多。 结语: 在这个测试中,笔者对基于Athlon 64 X2 4200+和Core 2 Duo E6300的两套系统进行了详细的测试,在整个测试过程中没有出现明显的异常情况,因此笔者相信这次测试的成绩是可信的。从整个测试的成绩来看,X2 4200+和E6300+的表现可以说是处在较为接近的水平,但以E6300的表现更好一些。即使在AMD传统的优势项目,E6300也取得了比X2 4200+更好的成绩,而在Intel的优势项目方面,E6300则保持了较好的水平。不过总体而言,既不会像AMD所宣传的那样X2 4200+以明显优势领先于E6300,也不是E6300完全抛离X2 4200+,虽然E6300在整体水平具有更高的性能,但两者的水平差距不大。 不过话说回来,虽然在整个测试中,两者的差距的确不算明显,但考虑到个体差异和平台差异,笔者并没有对测试的两颗处理器进行超频测试。要知道超频能力的高低是一个非常吸引DIYer的地方。从众多用户反馈的信息中,我们可以得到这样一个信息,那就是E6300普遍超到400MHz外频以上,超到500MHz外频的也不在少数,这样E6300的频率将达到3GHz以上,此时E6300的性能已经可以和最高端的X6800相媲美,也要比FX-62更强。但X2 4200+的情况不容乐观了,虽然超频能力也不弱,但是目前来说可以突破3GHz的X2处理器还是不多。这样的话,在频率领先的默认状态下,X2 4200+整体性能还是要比E6300弱一些,如果再算上超频之后的频率差距,估计X2 4200+就要处于更大的劣势了。 就目前的市场情况而言,X2 4200+和E6300的售价都处于1500-1600这个水平,都是中高端消费者选择的热门产品。但是从整体性能而言,笔者更偏向选择E6300,更强大的性能,更低的功耗和发热量,相信这将会成为吸引消费者的重要因素。 可以说,Core 2 Duo处理器的发布改写了整个处理器格局,取代了Athlon 64 X2成为了新的性能王者。不过AMD虽然让出了高端处理器市场,但经过大幅调价后的Athlon 64 X2仍是有相当的吸引力,尤其是在千元价位附近,Intel暂时还没有推出Core 2 Duo处理器来应对X2 3600+和3800+的挑战,只能凭借老迈的Pentium D来支撑市场。不过目前Pentium D处理器系列在市场是仍然是深受欢迎。尽管Pentium D低性能、高功耗,但它们却是当前最廉价的双核心解决方案。不过相信在不久的将来,当低端的Core 2 Duo E4300推出市场之后,Intel将会在双核处理器市场取得一次彻底的胜利,真正赢得反击AMD这场大战。 |