科技时代新浪首页 > 科技时代 > 硬件 > 正文

Core 2 Duo创新将AMD拉下技术神坛


http://www.sina.com.cn 2006年08月24日 10:15 eNet硅谷动力
作者:绯雨
  7月23日,Intel正式向世人发布了Core 2 Duo处理器,这一采用全新Core微架构的产品真正揭下神秘面纱,向世人展示其先进的架构和强大的性能。在此之前,AMD一直凭借K8处理器的优秀架构和效能在与Intel的竞争中占据优势,但面对全新的Core 2 Duo,AMD的技术优势将是一去不返,Core微架构已经把AMD拉下技术神坛!

  采用Core微架构的Core 2 Duo处理器与目前主流的采用Netburst微架构的Pentium系列处理器相比,其核心架构作出了重大的改变,其中五项主要的创新技术使得Core 2 Duo处理器的性能比上代产品提升40%,功耗却降低40%。也正是这五项创新技术,使得AMD处理器在Core 2 Duo面前显得全无还手之力,无论是技术还是性能,都只能甘拜下风。这五项创新技术就是宽区动态执行、智能功率能力、高级智能高速缓存、智能内存访问、高级数字媒体增强。  

  宽区动态执行(Intel Wide Dynamic Execution)

  当今衡量一款处理器的性能水平,已经不能再单纯的以频率的高低考量,而是更强调“每瓦特性能”,也就是所谓的能效比。“性能=频率×每个时钟周期的指令数”是英特尔提出的对性能的创新理解,英特尔宽位动态执行通过提升每个时钟周期完成的指令数,从而显著改进执行能力。

  
Core2Duo创新将AMD拉下技术神坛


  英特尔酷睿微架构拥有4组解码单元,相比上代Pentium Pro (P6) / Pentium II / Pentium III / Pentium M架构拥有3组可多处理一组指令。所谓四组解码单元,就是指能够在单一频率周期内编译四个x86指令。这四组解码单元由三组简单解码单元(Simple Decoder)与一组复杂解码单元(Complex Decoder)组成。简单讲,每个执行内核将变得更加宽阔,这样它们就可以同时获取、分配、执行和返回达4条完整的指令。带有2个内核的单枚多核处理器就可以同时获取、分配、执行和返回8条指令。

  英特尔Core微架构在提升每个时钟周期的指令数方面做了很多努力,例如新加入宏融合(Macro-Fusion)技术,它可以让处理器在解码的同时,将同类的指令融合为单一的指令,这样可以减少处理的指令总数,让处理器在更短的时间内处理更多的指令。为此英特尔酷睿微体系结构也改良了ALU(算术逻辑单元)以支持宏融合技术。

  
Core2Duo创新将AMD拉下技术神坛


  Intel 的宏指令融合技术在AMD的K8处理器(包括Socket 939和AM2)上并不存在,不过AMD拥有与微指令融合技术类似的技术。在 Athlon 处理器中,也存在有微指令融合技术。例如,一条 ADD [mem], EAX 指令在真正执行前中始终保持为一条指令。因此,它在缓冲区中也只会占据1个单元的空间。不过,在 Core 微架构中 load 操作和 SSE 操作等也可以被融合,而 K8 处理器则不行,它会把SSE操作解码成2条宏指令。

  微指令融合技术的目的就在于减少微指令的数目。处理器内部执行单元的资源有限,如果可以减少微指令的数目,就代表实际执行的X86指令增加了,可以显著提升执行效能。而且,微指令的数目减少还有助于降低处理器功耗,可谓有益无害。

  因此而言,Core 微架构要更具有优势。在一般情况下,它每个时钟周期可以解码4条X86指令,加上宏指令融合技术的话则最多可以解码5条X86指令。而 AMD 的 K8 处理器每个时钟周期只能解码3条。仅当多条复杂指令同时需要复杂解码单元进行解码的时候,K8 处理器的解码单元会胜过 Core 微架构的解码单元。但是考虑到实际程序中的绝大多数X86指令对应简单解码单元的事实,这种情况不大可能发生。

  智能功率能力(Intel Intelligent Power Capability)

  英特尔智能功率能力,可以进一步降低功耗,优化电源使用,从而为服务器、台式机和笔记本电脑提供个更高的每瓦特性能。新一代处理器在制程技术方面做出优化,采用了先进的65nm应变硅技术、加入低K栅介质及增加金属层,相比上代90nm制程减少漏电达1000倍。

  值得注意的是,英特尔加入了超精细的逻辑控制机能独立开关各运算单元,具体来讲,酷睿微体系结构采用先进的功率门控技术。以往功率门控技术实现起来十分困难,因为元件开关过程需要消耗一定的能源,而且由休眠到恢复工作也会出现延迟,但英特尔酷睿微体系结构已经解决这些问题。

  通过该特性,可以智能地打开当前需要运行的子系统,而其他部分则处于休眠状态,这样将大幅降低处理器的功耗及发热。  

  高级智能高速缓存(Intel Advanced Smart Cache)

  以往双核的无论是Intel的Pentium D系列还是AMD的Athlon 64 X2都是独立的二级缓存,核心之间数据只能通过系统总线来交换,这无疑占用了总线带宽和带来延迟,不利于核心之间的密切合作。当系统只需要其中一枚内核进行运算时,另外一枚内核将会处于闲置状态,而闲置内核就意味着闲置二级高速缓存。尤其是当另外的内核由于二级高速缓存负载过满而承受巨大性能压力的时候,这将是一种巨大的资源浪费。而Conroe拥有和Yonah一样的共享二级缓存,通过内部的Shared Bus Router共用L2 Cache脱离了对系统总线的依赖。共享智能缓存的设计也使得功耗和性能之间达到很好的平衡。在不同强度的运算强度下,Core微架构可以关闭其中一个核心而另外一个核心使用全部的二级缓存,以减少高速缓存错误并提高性能,而当不需要时也能够关闭部分的缓存单元以节约能源。这样可以降低二级缓存的命中失误,减少数据延迟,改进处理器效率,增加绝对性能和每瓦特性能,由此带来的强大性能是采用独立二级缓存设计的Athlon 64 X2所不能企及的。

  
Core2Duo创新将AMD拉下技术神坛


  智能内存访问(Intel Smart Memory Access)

  智能内存访问是另一个能够提高系统性能的特性,通过缩短内存延迟来优化内存数据访问。智能内存访问技术能够预测系统的需要,从而提前载入或预取数据,反映到用户的直接使用体验上,就是大幅提高了执行程序的效率。

  智能内存访问技术主要包括内存消歧(Memory Disambiguation)和增强的预取器(Advanced Prefetchers)。内存消歧提高了乱序处理的效率,因为它可以为执行内核提供内建的智能,以帮助其在执行完所有预先存储的指令前,预测性地载入指令即将需要执行的数据。经过内存消歧后,分别设置在一级缓存和二级缓存的预取器就会先将需要的数据载入到缓存中。为了让数据位于每个执行内核所需要的地方,英特尔酷睿微体系结构为每个一级高速缓存和二级高速缓存均配置了两个预取器。这些预取器同时检测多个数据流和大跨度的存取类型。这样它们便可以在一级高速缓存中“及时”准备待执行的数据。二级高速缓存的预取器可以分析内核的访问情况,以确保二级高速缓存拥有未来可能需要的数据。这两个技术配合能够最大化的使用总线带宽,减少突发性的数据交换造成堵塞。  

  高级数字媒体增强(Intel Advanced Digital Media Boost)

  高级数字媒体增强技术是一项可以显著提高执行SIMD流指令扩展(SSE)指令性能的特性。128位SIMD整数算法和128位SIMD双精度浮点操作减少了执行特定程序任务所需的全部指令数,将能够促使整体性能的增高。它们能够加快诸多应用的速度,如视频、话音与图像、图片处理、加密、财务、工程设计和科学应用等。分别使用SSE和MMX指令,SSE指令可以让编程人员开发出混合集合数、单精度数、浮点数和整数的算法,以改进英特尔架构。在许多前代处理器上,128位SSE、SSE2和SSE3指令在执行时均采用每2个时钟周期执行一条完整指令的不变速率,例如,一个周期执行下面的64位,下一周期执行上面的64位。高级数字媒体增强特性可以在一个时钟周期完成这些128位指令的执行,从而有效地将这些指令的执行速度提高一倍。通过增加每个周期处理的指令数量,英特尔酷睿微体系结构的整体效率得到了进一步增强。在运行包括图形、视频和音频的诸多重要多媒体操作、以及处理其它使用SSE、SSE2和SSE3指令的数据集时,高级数字媒体增强技术的作用还将更加明显。  

  当年AMD推出K8处理器之时曾扬言其微架构采用的新技术将领先Intel达到三到五年,K8处理器的性能也的确是十分优秀,在Intel拿出Core 2 Duo作为反击的武器之前一直处于领先的地位,K8微架构的领先也使AMD一度登上了“技术神坛”。但这所谓的“神坛”似乎阻碍了AMD前进的脚步,AMD在K8推出之后将近3年时间没有对其做出太大的改进,有的只是对微架构的Bug的修正等小修小补,即便是日前推出的Socket AM2处理器也只是在原有K8架构之上把内存控制器从DDR升级到DDR2,并增加了硬件虚拟机技术。AMD在对待Socket AM2平台上的态度给人多少有些敷衍塞责的感觉。老实说,很多之前在Socket 754/939时代被AMD培养起好感的普通消费者和DIY玩家对这次AMD“换汤不换药”的做法颇有微词。似乎在即将迈入次世代处理器的关键时刻,AMD丧失了当初在业界发布K8,在普及64位处理器上快人一步,锐意进取的积极作风。相对于AMD的停滞不前,Intel对原有的产品进行了大刀阔斧的改革,抛弃了落后的Netburst微架构,采用了比K8微架构更为先进的Core微架构。众多创新技术的加入使AMD在处理器微架构上的技术领先化为乌有,AMD也从此被从“技术神坛”之上拉了下来。

  虽然说技术对于众多普通消费者而言可能只是十分缥缈的东西,但先进的技术在处理器上反应出来的实际性能却是实实在在的。目前Core 2 Duo处理器已经正式发售,Core微架构的威力已不再是只能远观而不能实际感受的事情。从玩家反馈的信息可以看到,Core微架构的威力确实十分强大,Core 2 Duo的性能已经可以对AMD的处理器形成绝对优势。时至今日,AMD已经无法凭借已显老迈的K8再度在市场驰骋,传闻中足以与Core微架构抗衡的K8L也只是待字闺中,何时可以出世还是未知之数。如果AMD不及时拿出具有实质性改变的产品,就凭“吃老本”来和Intel新一代的Core 2 Duo处理器正面竞争,将面临着非常被动的局面。

爱问(iAsk.com)



硬件论坛】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭




科技时代意见反馈留言板 电话:010-82628888-5595   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2006 SINA Inc. All Rights Reserved

新浪公司 版权所有