科技时代新浪首页 > 科技时代 > 硬件 > 正文

不仅仅是提速 Intel性能酷睿革命


http://www.sina.com.cn 2006年08月21日 11:54 eNet硅谷动力
作者:红叶


不断的“创新”才是硬道理

对于CPU相信大家都已经是非常的熟悉了,其是计算机的大脑,计算机的一切活动都要通过它才能运行,作为整个计算机的控制者,它的改变意味这整台计算机的变化。就目前的PC平台市场来说,存在intel和AMD两个品牌的CPU产品,他们也都有隶属各自的Fans。2006年对于CPU市场来说是个不平凡的一年,就在2006年AMD推出了AM2系列产品,而intel则推出革命性的产品-酷睿。

不仅仅是提速Intel性能酷睿革命


从intel CPU的发展历程上看,按照其处理信息的字长,CPU可以分为:四位微处理器、八位微处理器、十六位微处理器、三十二位微处理器以及六十四位微处理器等等
1971年Intel 4004:
1972年Intel 8008:
1974年Intel 8080:
1976年Intel 8085:
1978年Intel 8086:
1979年Intel 8088:
1982年Intel 80186:
1982年Intel 80286:
1985年Intel 80386:
1989年Intel 80486:
1993年Intel Pentium or 80586:
1995年Intel Pentium Pro:
1996年Intel Pentium MMX:
1997年Intel Pentium II:
1998年Intel Celeron:
1999年Intel Pentium III:
2000年Intel Celeron II:
2000年Intel Pentium 4:
2001年Intel Celeron III:

INTEL CPU发展经历

1971年 推出世界上第一台微处理器4004
1978年 首次生产出16位微处理器:i8086
1979年 推出了8088芯片。
1981年 8088芯片首次用于IBM PC机
1982年 推出划时代的产品:16位80286芯片
1985年 INTEL推出了32位80386芯片
1988年 推出80386SX
1989年 推80486芯片,晶体管实破100万个
1993年 推出全新一代的高性能处理器奔腾
1996年 推出第六代X86系列CPU——P6 年底 推出了P55C,即奔腾 MMX
1997年 推出了影响力最大的CPU—奔腾 Ⅱ
1998年 推出性价比相当厉害的赛扬处理器
1999年 发布第三代的奔腾处理器—奔腾III
2000年 Coppermine128核心Celeron处理器 年底 发布了第四代Pentium处理器—奔腾

2000之后便是奔腾4的天下,也就是用户俗称的“P4”,而伴随人们生活水平的提高,工作复杂度的提升,人们需要一款可以拥有高性能的处理器产品,俗称的“P D”便出现了,P D带有双核心处理器,其可以处理更多的文件和工作。但是这并不能满足“贪婪”的消费者,他们还需要速度更快,性能更强,单位时间内处理更多事情的处理器,那么“酷睿”就诞生了。

关于“酷睿”的身世在2006年7月底前一直都被众多的用户所猜测,其中也不乏一些“命中”,那么“酷睿”到底是个什么样子?它提升了什么?它都能作些什么?下面我们将为大家一一解答。

“酷睿”的身世之谜

不仅仅是提速Intel性能酷睿革命


英特尔高级副总裁兼数字企业事业部总经理基辛格表示:“对英特尔而言,2006年将是一个转折点——转向新的制程工艺和新的微处理器架构,并推出新的平台,以帮助客户解决其所面临的棘手问题。我们将陆续推出一系列企业平台和技术,为开发人员提供更多可能,并带来令人兴奋的关键能力,以帮助 IT 管理人员更有效管理成本和运营业务。”从中我们不难看出intel对于“酷睿”寄予的希望。

2000年英特尔正式推出Pentium 4产品,它基于NetBurst架构,标志着NetBurst架构的开始,一直延续到Pentium M,这一架构仍顽强地发挥着它的作用。时至今年,2006年这一架构已足足走过了6个春秋。在计算机及微电子技术发展日新月异的年代,这样的架构为计算机用户效力如此之久着实不易。

事实上,寿命长并不能代表它尽善尽美,在当初Pentium 4刚推出的时候颇受争议的一项技术就是为提高主频而采用过多的管道设计,与当时的上一代主流产品Pentium 3比较时根据就体现不出性能优势。英特尔一直在沉默着总结教训,新一代酷睿架构在NetBurst架构之上,吸取成功经验加入先进的创新技术,围绕推动性能和能耗效率的提高,将平行计算的益处渗透到方方面面。开启了新计算体验的崭新一页。

不仅仅是提速Intel性能酷睿革命


从上图蓝(单核)、绿(多核)、红(多核)发展的三个阶段可看出,Intel的探索可谓曲折。在“当今”那条绿色的虚线之前,大段的蓝色部分意味着英特尔一直在基于NetBurst的架构上“折腾”,Pentium 4是一段时间成熟的产品,但就设计来讲,仍有很多值得商榷的地方。以流水线长短为例,奔腾Northwood和Willamette核心的流水线为20级比前代产品PIII或者Athlon XP的10级左右的流水线来说增长了差不多一倍。发展到目前市场上采用Proscott核心的Pentium D和Celeron流水线更增加到31级。在NetBurst架构中,英特尔将8级指令获取/解码的流水线分离出来,而Proscott核心有两个这样的8级流水线,因此严格说起来,Northwood和Willamette核心有28级流水线,而Proscott有39级流水线,是现在Athlon 64(K8)架构流水线的两倍。

众所周知,流水线越长,频率提升潜力越大,但是一旦分支预测失败或者缓存不中的话,所耽误的延迟时间越长。这就是它负面的影响。

酷睿微架构此时的出现,是非常有必要的,它改进了流水线设计,支持每个内核使用高效的 14 级流水线,在NetBurst流水线内部功能中,每时钟周期能够处理三条指令。英特尔宽位动态执行可以同时获取、分配、执行和返回达4条完整指令。更可以通过微融合将常用的指令融合为单个内部指令以缩短执行时间。

另外,在对缓存的命中方面,从前的架构也存在着不力的现象。种种不利的形势下,酷睿微架构浮出了水面。

“酷睿”好在哪?

购买一款产品对于消费者来说最关心的莫过于价格,而从目前市场上的intel CPU来看,酷睿的价格还是比较适合高端消费者,即使是酷睿的低端产品Core2 Duo E6300。

不仅仅是提速Intel性能酷睿革命


从eNet CPU频道的2006年8月17日的报价上来看, Core2 Duo E6300的市场售价基本处于Pentium D 830和Pentium D 840之间,而Pentium D 830和Pentium D 840的工作频率都为3.0GHz,但Core2 Duo E6300的工作频率仅为1.86GHz,那为什么我们还要推荐Core2 Duo E6300酷睿产品呢?原因我们将做出解答。

不仅仅是提速Intel性能酷睿革命


Conroe处理器作为Intel新一代的的双核心处理器,虽然保留了FSB(前端总线)的概念,但核心架构上已经做了相当大的改进。Conroe处理器采用的是共享二级缓存设计,有效的避免了目前SmithField、Presler双核处理器需通过前端总线才能相互访问的瓶颈,直接式L1对L1的资料交换,更是加强了处理器的Pre-fetch和Memory Disambiguation能力,绝对是处理器架构上的一次大革命。

首先让我们看看Conroe保留了哪些现在Pentium 4架构中的元素。

第一:双核心架构必然是保留的,种种迹象表明,日后将是双核乃至多核的天下。在酷睿™微架构中,双核心架构中缓存部分会有细微的变化。现在Intel双核产品是采用独立的二级缓存结构,这样做弊端大,成本也很高。因此在新架构中,两个核心将共享一个4MB的二级缓存。

第二:Conroe前端总线频率仍为1066MHz。前端总线受到制约的因素有很多,例如芯片组的发展水平或内存发展水平,再加上这并非英特尔急于在新架构中解决的主要问题,因此Intel现在还并不打算提升前端总线的频率。

第三:新架构仍然将采用乱序执行核心。

第四:64位扩展也是必不可少的一个方面。

再来看看新架构与旧的NetBurst架构相比,有了什么样的变化。

在架构变化中,第一个变化是处理器流水线缩短了。新架构要将控制能耗作为最主要的目标,因此不会将时钟频率提升得太高,不再需要太长的流水线。而且就算是使用较长的流水线,但芯片发热量的问题没有解决之前,频率也不会得到大幅提升,现在的Prescott就是最好的例子。

第二个变化:但新架构中令人关注的变化是不支持超线程技术。当然现在还不确定是否超线程技术就被英特尔彻底废弃了,但至少第一批基于这一架构的CPU将不支持HT技术。如果深入到超线程技术中探求一番就会发现,只有像NetBurst架构那样多的空闲执行单元,才有条件使用超线程技术,否则为什么Intel不在Pentium M中使用这项技术?现在新架构中仅采用14级流水线,这个深度和Pentium M大致相当,自然没有富余的空闲执行单元用于超线程应用。

除了采用较低的时钟频率外,英特洋使用了其他的手段来提升性能。

第一点:即在新架构中增加处理器并行执行单元,每时钟周期能够支持4个指令。同时执行指令数越多,意味着其处理能力越强,表现出来的性能越高。安腾CPU就是一个很好的例子。

第二点:使用乱序执行设计,提升处理器资源利用率。支持乱序执行架构的微处理器能够重新组织其指令流,以最大限度利用其执行资源。除此之外,存储指令的乱序执行还能够提高CACHE命中率并降低CACHE访问的延迟。

在降低CACHE延迟方面有一个关键技术,称之为:Memory Disambiguation技术,即在存数和取数指令都乱序执行的情况下,保证取数指令都能取回它前面的最近一条对同一地址的存数指令所存的值。比如如果一条取数指令在一条存数指令之后且两条指令的地址相等,但取数指令先访问CACHE,也要保证取数指令取回该存数指令的值。又如如果一条取数指令在一条存数指令之前且两条指令的地址相等,但存数指令先访问CACHE,也要保证取数指令取回原来CACHE中的值,而不是存数指令新存的值。这是有风险的。因为你刚刚读的数据可能会在CPU内部的处理过程中发生变化,从而出现错误。但是英特尔称,这个系统非常聪明,可以得到不会发生变化的数据。

从“酷睿”中用户能享受到什么?

酷睿微架构到底给我们带来了什么?它为用户提供的最主要还是更好的效能,对台式机的用户而言越高的效能能够降低电费和噪音,甚至不使用风扇或者风扇的噪音降低。当然Conroe高级媒体数字功能的出现,也为用户的游戏图形效能提供更好的体验。

不仅仅是提速Intel性能酷睿革命


对于移动用户而言,英特尔酷睿微架构意味着各种小巧的外形、响应迅速的计算性能,以及超长的电池使用时间,拥有世界级的 “移动” 计算能力。体现了英特尔与整个产业如何合作提供诸如无线连接、更长电池使用时间及更加时尚等特性。通过提高性能、功效,以及更快的多任务响应处理能力,英特尔酷睿微架构将显著改善各种环境中的用户体验,无论是在家中,在办公室里,还是在路途中。

不仅仅是提速Intel性能酷睿革命


在家中,用户能体验到更高的性能、超静音、美观与低功耗的电脑设计,得到更加完善、便于使用的娱乐系统。对于企业而言,英特尔酷睿微架构将降低空间与散热要求、以及服务器数据中心的电力要求,并提高客户机和服务器平台的响应速度、生产效率与功效。酷睿微架构总的设计目标为追求更高的每瓦特性能,即每一瓦特能量能够产生多高的性能,再换句话说就是要用尽可能低的能耗换取最高的性能。

不仅仅是提速Intel性能酷睿革命


此图为移动平台性能对比,与之前的产品相比,Merom将提升大于20%的幅度,而在台式电脑上,Conroe将有大于40%的提升;服务器更是超过了80%幅度的提升!这些强有力的数据,恐怕是最能说明问题了!架构的改变,带来了性能的革命性提升,同时由于65纳秒的工艺,功耗将更低。用户的最终体验将是非比寻常的,例如在后台运行杀毒软件的同时,一边进行着视频文件的压缩,听着音乐,浏览着网页,丝毫不会感到系统的吃力。

Intel酷睿具备的五大关键技术

酷睿微架构的设计,在于推动性能和能耗功率的提高,为跨越各个细分市场和不同能耗级别处理器的优化提供统一平台;为移动设备、桌面电脑和服务器细分市场提供优化。向多核处理进行移植还为许多其它进一步提高性能的微架构创新打开了大门。英特尔酷睿微架构就是指在提高性能和能效的微架构更新。在这一点上,英特尔酷睿微架构侧重于增强跨每个平台领域(如台式、服务器和移动)现有和新兴的应用与使用模式。该微架构围绕节能理念构建,在英特尔奔腾M 移动处理器微架构的基础上大幅扩展,吸收了许多新颖、领先的创新技术和已有的英特尔奔腾4 处理器技术,如宽数据路径(Wide Data Pathway)和流指令(Streaming Instruction)等。

不仅仅是提速Intel性能酷睿革命


全新的Intel 酷睿具备五大关键的技术:

1、英特尔宽位动态执行(Intel Wide Dynamic Execution)

在单个时钟周期内提供更多指令,提高执行效率与能效。每个执行内核的位宽更大,支持每个内核使用高效的 14 级流水线,同时完成(最多)4 条完整指令。

2、英特尔智能功率特性(Intel Intelligent Power Capability)

该特性仅在必要时,才向单个逻辑子系统提供电力,由此进一步降低功耗。

3、英特尔高级智能高速缓存(Intel Advanced Smart Cache)

其中包括一个共享的二级高速缓存。该特性通过最大程度地降低内存流量来降低功耗;当其它内核处于闲置状态时,允许一个内核使用整个高级缓存,由此提升性能。

4、英特尔智能内存访问(Intel Smart Memory Access)

该特性可通过隐藏内存延迟来提升系统性能,由此优化内存子系统的数据带宽的使用。

5、英特尔高级数字媒体改进(Intel Advanced Digital Media Boost)

现在,所有 128 位 SSE、SSE2 和 SSE3 指令均能在一个周期内执行,从而将这些广泛应用于多媒体和图形应用中的指令的执行速度提升了1倍。

以上五大创新技术基于4-wide和14级流水线设计,类似Pentium M的micro-ops fusion技术允许将相类似的编码指令“融合”并一同送往流水线,更高级的macro fusion技术则允许x86指令在编码阶段之前进行“融合”并当作单独一条指令送往流水线。另外,在Core架构中,SSE指令(包括SSE1/SSE2/SSE3)也从原来的64位升级到128位。在下面的文章当中我们将详尽介绍此五大特性。

英特尔宽位动态执行(Intel Wide Dynamic Execution)

通过英特尔酷睿微架构的英特尔宽区动态执行技术,多核处理器中的每个执行内核都更加宽阔。这样每个内核均可以同时获取、分配、执行和返回4条完整的指令。带有4个内核的单枚处理器就可以同时获取、分配、执行和返回16条指令。

动态执行包含多项技术:数据流分析、预测执行、乱序执行与超标量。

目前有越来越的处理器的设计方向开始从乱序执行 (OOOE,或者 OOO)转向顺序执行设计,这些设计普遍更多地使用超长指令集,这些设计更依赖于多线程以及对编码器和编辑器的性能。但是酷睿微架构的设计仍旧是坚定的传统乱序执行设计思想的体现,可以说将OOOE设计思想的巅峰之作。总体说来,酷睿微架构是比NetBurst 微架构或者 Yonah 微架构更宽、更多硬件资源以及更大规模的产品。几乎在酷睿微架构流水线上所有的组成部分都被强化设计了:更多的指令解码逻辑单元;更大的乱序指令缓冲空间;更多的保留站入口;更多的指令调度端口;更多的执行硬件;更多的内存缓冲空间等等。简而言之,“尽可能增强所有对性能有益的配置”似乎成了英特尔以色列海法设计团队的研发Core的指导思想。

在前端,宏融合(acro-fusion)、指令融合(icro-ops fusion)以及强壮分支预测单元(BPU)一起保证执行核心有足够的代码供应量;在后端,大规模扩充的指令窗口确保在每周期供给执行单元足够的指令数量。此外英特尔还解决长期存在于以前设计中的SSE指令处理瓶颈,比起前辈们在SIMD指令处理方面有两到三倍的提高。

宏融合Macro-fusion

所谓宏融合即针对译码工作前的X86指令,可以在预解码阶段将相似类型的X86指令进行融合操作,然后将其送入单译码器中产生一条微指令操作。这项操作的对于X86指令的针对性很强,并不是所有的X86都可以进行,比如像compare 和test指令就可以和分支指令相融合译码,只会产生一条微指令操作。在酷睿的四个译码器单元中,每一个单元都有一周期完成一次宏融合到产生微指令的能力,但是总体存在每周期产生一条微操作的总限制。增加微指令融合不但要在预译码部分和译码部分的流水线增加新的硬件设计,同时也要对后端的ALU和分支执行单元进行修改。这些新增加的硬件部分负担会被宏融合带来节省后端硬件开销弥补,因为宏融合在同样的X86指令输入数量下产生更少的微操作指令,最终完成同等工作需要更少的后端硬件开销,从酷睿核心整体来看就是获得每条X86指令最佳的功耗效率,这就是Intel为何努力尽可能的让译码单元获得X86指令和处理器执行的微操作指令的1:1 译码产生率的原因。

不仅仅是提速Intel性能酷睿革命


当然,如果说宏融合可以在更少的ROB以及RS后端硬件资源下完成等同甚至更多的工作,那么也意味着该技术的应用为同等或者更宽更强大的后端硬件提供了足够的前端译码能力,总体获得了更大的执行带宽。一个单ALU可以执行一条实际上是两条X86指令融合后的微操作,就好比两条指令同时并行运行,即相同的执行单元数量的前提下获得更强的处理能力。

微指令融合Micro-ops fusion

微指令融合是英特尔在Pentium M首次导入的技术,在效果上和前面说到的宏融合类似,都是尽可能的减少微操作指令的生成数量,但是运行原理却是不同。一般情况下,简单译码器接受了通常转化为两条微指令的X86指令后,它就会产成一对相关联的微指令对,通过ROB的单独入口进行追踪。当这个指令对进入保留站,其中每一个成员指令被允许单独调度分配,根据两条指令的并行度决定它们是并行通过两个不同的调度端口,还是连续的从一个调度端口抵达执行单元。最为常见的关联微操作指令就是载入和存储命令,我们可以来看看它们在P6构架上执行的过程,这样更容易理解Core的微指令融合的不同之处。

在P6构架上,存储指令被分解成两条微指令,存储地址计算微指令和存储数据微指令。前者负责计算数据存储的地址,它是由P6构架中的地址产生器处理然后将生成地址暂存在存储地址单元等待执行;后者存储数据微指令将数据存入到外部存储数据缓冲区,当存储指令完成,这部分数据就被写入外存即系统内存,这条微指令由P6构架中的存储数据单元执行。因为这样的两条微指令存在固有的并行关系,它们可以通过两个不同的调度端口进入不同的执行单元处理,当数据写入到存储缓冲的同时,存储地址已经计算出来了,两条微指令形成自然而然的并行运行关系。

而英特尔说明在Pentium M处理器后,上述传统的P6构架的译码单元结构出现了变化。它不再将存储指令译码为两条单独的微指令,而是将它们融合成一条。这条指令以融合状态通过调度端口,直到抵达真正的存储单元后,才被执行核心分别处理。融合的load操作与此类似,采用了串行调度替代了并行调度方式。

类似于宏融合,微指令融合在更少的入口和硬件开销下让ROB具备更多的微指令调度和提交能力,等同于把Core执行前端译码器、分配器、调度部分的带宽都等效提高了,为每周期处理更多的X86指令提供了前提,也为总体构架性能提升贡献不少。提升前端效率,意味着达到同样处理能力后端可以适当简化,同样可以达到降低处理器功耗的作用。

为了达到性能和功耗的均衡设计,英特尔花费了大量的晶体管在酷睿微架构的分支预测单元上。为什么如此呢,其实现在的处理器设计中,内存和处理器的距离(以CPU周期衡量)不断增大,花费如此多的晶体管资源在分支预测硬件的构建上因为能获得和这种投入相称的回报。我们知道,如果分支预测没有命中,就会用相对慢得多的速度从主内存中重新取得正确的分支目标;在这个漫长的时间里,在单线程处理器处在空闲状态,浪费执行资源,是没有产出的纯功率消耗。所以优秀的分支预测单元不仅关乎处理器的性能,而且极大提高处理器单位时钟有效性,从而达到节省功耗的作用。

酷睿微架构本质上仍旧使用了为Pentium M.开发三段式分支预测器,其核心组成部分是一对预测单元,包括一个双峰统计预测单元和一个全局预测单元,它们记录了最近执行过的分支记录信息。这些预测器基于这些过去的执行历史记录决定处理核心前端可能下一步的分支预测结果。如果处理内核前端决定了要执行的分支,那么分支预测器从分支目标缓存中(BTB)取回分支目标代码的地址,然后依照这个新的地址定位取得相应的指令。

英特尔智能功率能力特性(Intel Intelligent Power Capability)

我们迄今为止所讲述的都是有关性能提升的问题,说明酷睿微架构是一个执行效率远高于NetBurst 的设计,但是我们是否遗漏Pentium M 血统的一个重要特征呢?那就是优秀的功耗控制。所以,在下一代基于Core构架的产品,无论是桌面还是服务器平台,所有的处理器都会享用到Intel以往移动平台处理器的功耗优势。

不仅仅是提速Intel性能酷睿革命


不过我们要说的是Conroe在运行过程功耗控制能力甚至超越单纯移动处理器的Pentium M,为此,Intel为处理器配备了不少先进的功率门控制系统。举例来说,处理器可以在运行中关闭用不到的特定逻辑处理单元,在降低功耗和发热的同时保证不影响性能;同样处理器中的总线模块在不需要使用时也可以转换为低功耗状态。

在过去要实现功率门控制非常困难,因为关闭电源和备份时会需要大量功率,而在回升至全功率是,还要保证系统和子系统的响应性。通过这项被英特洋称为“智能功率能力”的技术,这些不可能完成的任务均得到了满足。

那么这项英特尔强调每瓦性能的指导思路下的Core微构架最后的效果如何呢。根据会上英特尔提供的资料,即马上到来的基于酷睿微架构的Conroe处理器,在其性能超过目前的Pentium D 950 40%的同时,其功耗却降低了40%。而面向服务器端的Woodcrest相比双核心 2.8GHz Xeon更是提供惊人了80%的提升和35%能耗降低,这的确是一个值得炫耀的跨越。

英特尔高级智能高速缓存(Intel Advanced Smart Cache)

在缓存结构上,酷睿微架构仍旧延续了Yonah的共享式二级缓存设计,被称为高级智能高速缓存。我们要了解该设计的优势之前,需要明确目前多数的多核心产品均不能在执行内核之间共享二级高速缓存。这意味着当两个执行内核需要同样的数据时,每个内核均得将数据存储在自身的二级高速缓存上。而且每当一个内核运算改变自己二级缓存的数据时,必须通过FSB和另外一个二级缓存交换变化数据,始终保持一致性,这也大大增加了FSB的流量负担。而共享式二级缓存不同,数据仅需存储在每个内核均可访问的同一个地方,能更加充分利用二级缓存资源。

不仅仅是提速Intel性能酷睿革命


之所以称为智能,是因为在Conroe的二级缓存上可以让每个内核动态的利用高达100%的可用二级高速缓存。当一个内核只需要较少的二级高速缓存时,其他内核便可以增加其二级缓存的百分比,减少缓存错误提高性能。在实际成品Conroe的4M共享二级缓存起到的作用远大于两个独立2M二级缓存简单相加容量的提高。

此外,在多线程多任务处理应用中,相关中间数据可以直接通过共享二级缓存在两个内核线程中共享,大大降低了FSB的重复利用。就拿典型的转换视频文件格式来说吧,该应用通常要涉及解码和重新编码两个过程,解码后获得的数据是重新编码的操作数据。传统的独立二级缓存双核心处理器遵循如下的处理方式,解码线程运行的内核获得解码后数据,通过FSB写入内存,然后另一个内核的编码线程再通过FSB从内存读取前面解码获得中间数据,经过编码后再通过FSB写入内存,此间有四种数据流共同占用FSB资源,使得FSB过分拥挤并且增加了很多访存延迟。而Conroe的高级智能共享二级缓存技术允许第一个解码线程直接把中间数据写入到大容量共享二级缓存中,而编码线成直接从这里获得中间数据进行后续工作,如此以来不但原来FSB流量最大的中间数据存取到内存的过程不见了,因为它所增加的访存延迟也没有了,整个过程效率也得到极大的提高。

之前英特尔和AMD有关“真假双核”的核心争议就是是否存在内核间的直连构架,但是后者直连构架的交换数据正是弥补独立缓存造成的问题,而英特尔如今的共享高级智能二级缓存推出后,相信诸如此类的争论也会销声匿迹了。

英特尔智能内存访问(Intel Smart Memory Access)

传统的乱序执行处理器都存在这样的一个准则,在指令修改某个内存地址内容前必须确定之前指令的对该地址内容的读取都完全执行了,这是乱序执行处理器重新对指令排序必需要遵从的一个重要准则。

内存混淆发生过程

当存储和载入对同一个地址产生操作,两条指令就发生了我们所说的“内存混淆”情况,超过97%的内存访存指令实际上都指向了正确单元,这样的操作实际上是无相关性的内存单元进行访问,是理论上的独立指令。但是就是为了剩余这3%的内存混淆情况,P6构架和Pentium 4都使用了偏向保守的访存排序策略:如果读取的地址尚未确定,那么它始终不能提升到储存操作之前,以此来避免后续获得的读取地址和存储地址相同发生的冲突。

不仅仅是提速Intel性能酷睿革命


这种做法看起来非常的安全,但是也非常保守,因为绝大多少的载入-存储操作不会发生内存混淆,这种大而化之的处理方法会带来性能的下降。

英特尔在酷睿微架构中全新加入的内存消歧技术就是用来解决上述问题的。该技术能智能识别内存混淆是否发生,在确认不会发生后,以往在 P6构架和Pentium 4中载入操作不能提前到不明地址存储操作之前的限制就不存在了。这一设计会起到非常明显的性能提升。

除了内存消歧外,英特尔的智能内存访问还包含增强的预取器。预取器负责提前获得内存的内容,并将其放入处理器的高速缓存中,以备读取。增加从高速缓存而不是内核的装载量将会算短内存延迟并提高性能。为了让数据位于每个执行内核所需要的地方,酷睿微架构为每一个以及高速缓存和二级高速缓存均配置两个预取器。这些预取器同时检测多个数据流和大跨度的存取类型。这样就可以在一级高速缓存中“及时”准备待执行的数据。二级高速缓存的预读器可以分析内核的访问情况,确保二级缓存拥有未来潜在需要数据。

通过内存消歧和增强型预取器,英特尔最大化的拓展了系统总线带宽和隐藏了内存子系统的延迟,从一定程度上拉近了和对手集成内存控制器的延迟差距。同样,要达到媲美集成内存控制器的效果,共享型高级智能缓存也功不可没。

英特尔高级数字媒体改进(Intel Advanced Digital Media Boost)

对于苹果电脑迷们来说,苹果迁移到Intel平台可能让他们最不放心的就是失去了原有PowerPC处理器上的AltiVec技术, 不过这些用在现在可以放心了,因为酷睿微架构特别改进了它的前辈糟糕的矢量处理能力,也就是常说的单指令多数据(SIMD)性能。

在上面讲述Conroe执行单元结构的时候提到,128-bit浮点算术运算操作通过 FADD/VFADD 和 FMUL/VFMUL 两条流水线进行,这两个单元是矢量和标量浮点操作兼顾的设计,其中每一个都可以进行浮点和矢量计算器移动操作。

从获得的信息来看,矢量整数单元连接在 ports 0 和 1上的设计被扩展到 128 bit,这样就顺理成章的具备了单周期完成128bit的矢量整数的能力。我们现在假设它们的构造和PIII类似,一个单元负责 128-bit VALU/shift操作,而另一个负责 128-bit VALU/multiply操作。

Conroe对提高处理SSE/SSE2/SSE3处理能力的最大改进之一:为所有矢量处理单元提供真正的128-bit 数据通路。

不仅仅是提速Intel性能酷睿革命


真正的128-bit矢量处理能力

当Intel决定为Pentium 产品线加入SIMD扩展指令(SSE),用以获得128-bit 矢量处理能力的时候,其结果并不像程序员或者是最终用户想像的那么完美。 SSE以及它们的继任者 (SSE2 and SSE3) 在P6 和PM(Banias)构架上运行都存在两个设计缺陷:在本身的扩展标准上,SSE的主要缺陷是缺少对三操作数指令的支持,这就让它在执行效率和性能上比起PowerPC上的AltiVec 落了下风。在实施硬件设计上,Intel将128-bit 操作硬生生的塞入P6核心的64-bit 数据通路中也大大限制了128-bit SSE 操作的性能发挥。

我们知道P6 核心用以传输浮点运算和MMX指令的数据总线只有64bit位宽。这样以来连接SSE执行单元的输入端口也同样只有64bit的位宽了。为了在64-bit SSE 单元上执行128-bit的长指令,P6必须先把这条长指令分解为一对可以在后续周期中可以执行的一对 64-bit 指令。

在新的Core构架上,英特尔这次终于为我们提供了单周期延迟的128-bit 矢量操作能力。Intel通过将浮点和矢量内部传输总线提升到128bit位宽彻底解决了这个问题,另外这一设计的改变也意味着每一条128bitSSE指令之需要产生一条微操作指令,这样新的设计不但消除了执行矢量操作过多延迟,更少的微指令产生量也等同于提高了译码、分派、调度整个内核前端的等效带宽。无论是输入还是输出,其位宽都比它的前辈们有了成倍的提高,以用来适应每周期的128 bit数据传输。

当我们把上述重要的改进放在一起的时候,一个英特尔有史以来最为强悍矢量处理怪兽处理器诞生了。英特尔的技术人员如此形容Conroe的强悍能力,一次 128-bit多数据乘法、一次 128-bit多数据加法、一次 128-bit多数据载入、一次 128-bit多数据储存,一次cmpjcc(y一次比较+一次跳转)的宏融合,上述所有操作在同一个周期都可以搞定,这相当于每周期六条指令的执行能力,比起以前的产品有着飞跃成长。

Intel Core 2 Duo的型号命名法则

Intel Core 2 Duo处理器的型号命名法则,将会共用现时用于Yonah核心Intel Core Duo处理器的系统,由一个英文名母配撘四个数字达成,其中E、T、L、U分别代表TDP功耗表现,E代表处理器将超高50W TDP以上,主要针对桌面电脑应用,T代表处理器的TDP表现介乎25W-49W之间,大部份主流的行动电脑处理器均为T系列。L代表低电压版本处理器TDP表现介乎15W-24W,U则为超低电压版本处理器其TDP将低于14W。值得注意的是,针对Athlon 64 FX而推出Core 2 Extreme没有被规范于TDP功耗表现之中并将会以X作代表。 

不仅仅是提速Intel性能酷睿革命


不少媒体报导Conroe处理器为Core 2 Duo E系列而把Merom定为Core 2 Duo T系列,但这个说法是错误的,因为开首的英文字母只包括功耗表现并不包括产品家族含意,如果Conroe推出低电压版本亦可以被命名为Core 2 Duo T6300,因此我们分辨Conroe及Merom正确要注意是开首数字,它是代表著产品家族的,例如Conroe 桌面处理器1066MHz版本为6、800MHz版本为4、Merom行动处理器为7、Yonah行动处理器双核心版本为2、单核心版本为1,如此类推。 

第二位数字是产品规格,在相同的家族规格产品中,数字越高规格越高,但却不一定只有时脉上的差别,例如Core 2 Duo E6400(2.13Ghz/2MB L2/1066MHz FSB )和E6600(2.4GHz/4MB L2.1066MHz FSB)之间,就拥有L2 Cache容量的差别,因此第二位只是提供了较简单的规格慨念,用家还是得查看Intel产品的SKUs才能得知最终规格。另外,在不同的功耗表现系列下,纵使拥有是相同的产品家族,其第二位数字的产品规格含意亦有差别,例如Intel Core Duo T2500(2GHz/2MB L2/667MHz FSB)和IIntel Core Duo U2500(1.06GHz/2MB L2/533MHz),同样是2500但规格却有著天壤之别,所以我们不能用数字型号作出效能上的对比,因为它并不是R-Rating。最后的两个数字则保留日后处理器再增添功能时,用作产品规格的资料,例如就有如Intel Pentium 4 640和Pentium 4 641,在相同的规格中却用全新的65奈米制程,Intel并不会因此而把整个产品家族更新,只会在最后两个数字作出识别。

酷睿的主板选用

相信最令人关心的将是Conroe与晶片组的兼容性,现有Socket 775主机板用家能否直接升级Conroe处理器呢!?据Intel官方的回覆是Core 2 Duo E6000将会支援上一代最高阶的975X晶片组及新一代965晶片组家族,而其中975X产品支援与否则要视乎该975X主机板是否支援VRM 11供电模组设计,由于上代Intel Netburst产品只要厂商按照VRM 9规格便可,因此市面上大部份的975X均不能单纯以升级BIOS方法而达成支援Conroe处理器,而需要厂商推出支援VRM 11的新版本975X产品才可。

不仅仅是提速Intel性能酷睿革命


图片源自HKEPC

与Intel Pentium Extreme Edition相同, Core 2 Extreme亦被限制其晶片组支援能力,只有i975X及P965才能正常运作Core 2 Extreme版本,其余Q965、G965及Q963均只支援至Core 2 Duo E6000系列。在2007年第一季将会推出800MHz版本的Core 2 Duo E4000家族及2007年第三季推出的Conroe-L低阶产品,除了以上所述的晶片组均能支援外,低阶晶片组产品946GZ及946PL均可支援800MHz FSB Conroe处理器。 

其他旧有晶片组是否不支援Conroe处理器吗!? 不是的,原来只要是支援双核心的晶片组,只需采用上VRM 11供电模组设计,便能支援Conroe处理器,大家可以浏览一下AsRock (http://www.asrock.com.tw)的网站,可以发现他们采用上i865G及i945GL达成了Conroe的支援,其中i865G更凭著AsRock工程师的能力,达成了1066MHz FSB Conroe处理器的支援,令人惊讶。其他晶片组包括ATi、nVidia、SiS及VIA的晶片亦是只需要升级VRM 11供电模组便可。 

最值得注意的是,为何Intel 915及925晶片组并不支援Dual Core处理器呢?据某厂商私下透露,由于某台湾一线厂商把用于Desktop的875晶片组支援两路Xeon伺服器主机板上,令Intel十分震惊及担心影响Xeon晶片组的销售,因此在下一代915及925晶片组中删去了SMP的支援,由于支援多核心处理器的晶片组需要晶片支援SMP,因此915及925从来没有被支援Dual Core,相反比它还要旧的865/875却能支援,或许是当年Intel还是深信自己的产能技术可以继续时脉的增长,并不需要在桌面平台中使用上多核心技术。 

为桌面1333MHz FSB铺路 07年Q2推出Bearlake晶片组

不仅仅是提速Intel性能酷睿革命


图片源自HKEPC

虽然早前不少报导指出,Core 2 Extreme将会采用预设1333MHz FSB架构,但其实这是并不可能的,虽然桌面级Conroe处理器和伺服器WoodCrest处理器采用相同的Core微架构,理论上是可以达1333MHz FSB的,但WoodCrest所配备的是用全新的Bensley及Glidewell 晶片组,设计时已规划支援1333MHz FSB,可是桌面晶片组包括现有的i975X及即将发布的965家族规格最高只支援至1066MHz FSB,因此Conroe桌面处理器要支援1333MHz FSB只能留待2007年第二季,Intel将会推出全新的主流级桌面晶片组代号为Bearlake,未来将取代2006年6月5日发布的Boardwater家族,将会是首个支援1333MHz FSB的桌面级晶片组产品,并配搭全新的ICH9家族南桥,据主机板业者透露此晶片组很可能同时内建支援DDR2及DDR3记忆体控制器,情况有如当年915家族同时支援DDR及DDR2。和BoardWater一样,Bearlake将会采用商业平台版本 Bearlake Q、桌面主流级版本Bearlake P及内建绘图核心版本Bearlake G,而直至现时为止,Intel尚未有计划推出高阶桌面晶片组版本,取代现有的i975X晶片组。

酷睿-Core 2 Duo E6700

s对于酷睿CPU,我们曾经作过多次报道,从早期的传言一直到如今的现实,从不敢相信到坚定不移,从无缘说起到有据可依。一起的一切都要靠事实来说话,近期enet硬件评测室拿到了Core 2 Duo E6700产品,其仅次于目前Core 2 Duo的最高端Core2 Duo E6800,虽然是ES版。下面就让我们先来看看它的庐山真面目。

不仅仅是提速Intel性能酷睿革命


不仅仅是提速Intel性能酷睿革命


这是一枚供测试用的Core 2 Duo E6700工程样品,使用LGA775封装,外形和早前的众多LGA775封装处理器并无不同,由Intel在马来西亚的工厂封装。产品的正式出货型号并没有直接标注在这些散热顶盖上,但是我们能通过第三行的识别代码来认识这些处理器的细节。其中“80557”是Conroe核心的代号,“PH”表示1066FSB,最后的“4M”则意味着它的L2 Cache容量为4MB(两核心共享)。让我们回忆一下早先的CPU标识代码,Smithfield系列为“80551”,类似的“PG”和“PH”分别表示800FSB和1066FSB,而Presler为“80553”。

不仅仅是提速Intel性能酷睿革命


不仅仅是提速Intel性能酷睿革命


不仅仅是提速Intel性能酷睿革命


Core 2 Duo使用LGA775型接脚,物理形式与其他LGA775处理器相同,对应核心位置的处理器底部贴片电容元件有所变化。

测试平台及CPU-Z检测

对于新款的Core 2 Duo 产品来说应该有新款的主板来支持,为此目前主板市场当中大量充斥着I965P,I946P,I975P芯片组主板,同时NVIDIA和ATI也有专为其打造的芯片组。在我们进行的测试当中我们选用了技嘉的GA-965P-DS4主板,此款主板无论从价格上还是从性能上都比较适合中端用户。

技嘉在Intel P965芯片组上可谓了下足了功夫,共推出了三款产品,价格也是从13XX~20XX元不等。继GA-965P-DS3上市后,近期DS4也已经批量到货。目前商家报价1788元,处在中间的位置,它的功能也要比DS3强一些。技嘉GA-965P-DS4主板采用P965+ICH8芯片组,支持Intel全线LGA接口处理器,支持FSB1066,支持DDRII800内存,同时支持双通道技术。

不仅仅是提速Intel性能酷睿革命


不仅仅是提速Intel性能酷睿革命


ICH8南桥芯片,主要基于ICH7在功能方面作了稍许良改,例如将由8个USB Port增至10个,并支持Dual Hi-Speed Controllers独立USB接口停止运作功能,SATA Rev.2.5接口数量4个,提供Active Management Technology功能,并首次内建Gigabit Ethernet MAC网络功能。但大家要注意的是ICH8将会全面取消AC 97音效只保留High Definition Audio输出,而且亦不再提供P-ATA的IDE控制器,迫使用户完全进入SATA时代。不过近期主板厂商仿佛并没有这么激进,通过第三方芯片提供了对PATA接口的支持,另外通过该芯片,主板还提供了另外两个SATA接口。网卡配置为88E8053,来自Marvell的PCI Express的千兆以太网控制芯片,它提供了桌面和移动应用中高可靠性和低成本的千兆以太网连接,完全兼容PCI Express 1.0a规格。由于南桥不再支持AC 97音效,因此主板通过ALC 883提供了High Definition Audio输出功能。

扩展槽提供了1条PCI-Express X16、2条PCI-Express X1、1条PCI-Express X4(桔黄色)和2条标准PCI,能够实现双卡四屏幕的输出效果。整合的德州仪器的TSB43AB23提供了3组IEEE139A,除I/O背板的1组外置,余下的2个需要扩展实现。处理器供电部分采纳了6相回路的方案,用料选择了防磁电感和三洋SVP固态颗粒,用料可谓奢华。1788元的价格对于中端消费者来说还是很合适的。

CPU-Z

通常情况下,多数人在拿到新款CPU的时候都会使用CPU-Z来检测此款CPU。当然我们也不例外,因为CPU-Z最为直观。

不仅仅是提速Intel性能酷睿革命


不仅仅是提速Intel性能酷睿革命


1.35版本CPU-Z能正确识别出的Core 2 Duo E6700,这块工程样品提供6-10区段的倍频调节,软件识别出双核的两个处理器。就每一个核心而言,它包括1066FSB、32KB L1数据缓存、32KB L1指令缓存,两个核心共享4096KB L2缓存。功能方面,Conroe并不支持超线程技术,Con支持Intel Virtual Technology、Intel EM64T、Execute Disable Bit以及EIST(Enchanced Intel SpeedStep Technology)节能技术。配置Conroe核心处理器的主板需要符合供电模块的VRM11规格。

测试部分

为了能够比较全面的测试出Core 2 Duo E6700性能,我们在测试软件方面也选择了一些十分有代表性和权威性的测试软件,其中包括Sisoftware Sandra 2007、CPU-Z、Super-pi、3DMark2006、PCMark 2005、WinRAR、Lame、FarCry、DOOM III、FEAR等。

不仅仅是提速Intel性能酷睿革命


首先我们先来通过 Sisoftware Sandra 2007的Processors来观察Intel Core 2 Duo E6700的信息。

在CPU的测试历程当中首当其冲的必然属于Super pi,由于其操作简单同时也可以比较迅速的分辨CPU的计算速度,其得到了绝大多数玩家的认可。

不仅仅是提速Intel性能酷睿革命


Intel Core 2 Duo E6700在Super Pi 104万位上的计算结果仅用了19秒,那么同比来说AMD AM2 5000+又是什么水平呢?



34秒的AM2 5000+实在让人有点......

Sisoftware Sandra 2007测试









3D mark05测试



由于3DMark05提供了对微软DirectX 9.0C的支持,所以完全支持Shader Model 2a、2b、3.同时加入的更加详细显示控制面板,可以使用户对测试进行更为详细的画面控制。3DMark05还使用了全新的更为类似游戏的3D引擎,使测试更接近于正常的游戏运行。它包含了三个全新的测试场景,分别为:Return to Proxycon、Firefly Forest、Canyon Flight,通过这三个场景的测试便可以得出分数。另外,3DMark05还包含了CPU Testill Rate Test、Single Texturing、Multi Texturing、Pixel Shader Test、Vertex Shader Test和创新的Batch Size Tests。



3D mark06测试



3DMark06主要使用最新一代游戏技术衡量DirectX 9级别的3D硬件。此前的3DMark都是随着新版DirectX和新一代硬件的发布而推出,在一定程度上限制了3DMark对最新硬件性能的充分挖掘。现在DirectX 9已经发布3年,该级别的硬件已经遍布高中低各个领域,因此3DMark06终于可以完全利用DirectX 9的特性。事实上,3DMark06所有测试都需要支持SM3.0的DirectX 9硬件,不过只支持SM2.x的硬件也可以运行大部分测试。





PCMARK05测试



PCMark05是PCMark系列的第三版,并且这是为测量个人计算机性能的一个优质工具。还是一个全新产品和以最先进的工作量为特色, 包括HD 录影自动译码, 数字式音乐内码, 先进穿线和基于追踪的硬盘性能测试。使能真实地客观表现在最新的个人计算机平台和建筑学之间和支持所有最新的技术,以使能准确评价最新的个人计算机。





Xmpeg 5.0.3 with DivX Pro 5.1.1 codec测试



XMPEG是FlaskMPEG的修改版,是一款优秀的DVD编码工具。Lang目录下chinese.lang.Xmpeg为中文语言包,只要把其它语言文件移除即可显示中文。

在Xmpeg的测试环节,Intel Duo E6700获得了6分30秒的好成绩。

游戏测试-Far Cry



● FarCry测试简介: 

由育碧出品的《FarCry》完全可以在今年发售的游戏大作中占有了一席之地,其惊人的技术表现已经受到众多玩家的强烈关注。游戏采用的图形引擎名为“X岛”,该引擎在表现一些充满各种植物的热带丛林岛屿方面效果惊人,该引擎还支持一种叫作“polybump”的特效,利用该特效即使在物体多边形数不是很多的情况下也能给人一种十分逼真的感觉。在一些动态光源的情况下能够展现逼真的光影效果。 

Farcry对系统的要求极其苛刻,显卡方面,目前的中端显卡在高画质下运行此游戏也比较困难。游戏的采用了多边形贴图,比凹凸贴图更加具有质感。室外场景的渲染让人感觉惊艳,特别是游戏对水的渲染几近真实,在水下可以清晰看到水面上的景物,水面的倒影和浪花的效果也非常的棒。 

● FarCry测试设定: 
软件版本:FarCry正式版 1.3
支持 API:DirectX9.0
测试方式:Ubisoft-Volcano、Ubisoft-Training
模式:所有效果均为默认,1024×768和1280×1024





游戏测试-F.E.A.R



相信众多用户会对Intel Core2 Duo E6700的发热量感到一些不安,不过通过笔者的测试发现,其并没有想像中的那样热,经过长时间的测试,散热器上的散热片依然不会感到发热,注意:这是双核CPU,能够把发热量控制到这种程度,也就是Intel了吧。



Speed Fan监测数据

总结

谁是“技术之王”

当年AMD推出K8处理器之时曾说其微架构采用的新技术将领先Intel达到三到五年,K8处理器的性能也的确是十分优秀,在Intel拿出Core 2 Duo作为反击的武器之前一直处于领先的地位,K8微架构的领先也使AMD一度登上了“技术神坛”。但这所谓的“神坛”似乎阻碍了AMD前进的脚步,AMD在K8推出之后将近3年时间没有对其做出太大的改进,有的只是对微架构的Bug的修正等小修小补,即便是日前推出的Socket AM2处理器也只是在原有K8架构之上把内存控制器从DDR升级到DDR2,并增加了硬件虚拟机技术。AMD在对待Socket AM2平台上的态度给人多少有些敷衍塞责的感觉。很多之前在Socket 754/939时代被AMD培养起好感的普通消费者和DIY玩家对这次AMD“换汤不换药”的做法颇有微词。似乎在即将迈入次世代处理器的关键时刻,AMD丧失了当初在业界发布K8,在普及64位处理器上快人一步,锐意进取的积极作风。相对于AMD的停滞不前,Intel对原有的产品进行了大刀阔斧的改革,抛弃了落后的Netburst微架构,采用了比K8微架构更为先进的Core微架构。众多创新技术的加入使AMD在处理器微架构上的技术领先化为乌有,AMD也从此被从“技术神坛”之上拉了下来。

虽然说技术对于众多普通消费者而言可能只是十分缥缈的东西,但先进的技术在处理器上反应出来的实际性能却是实实在在的。目前Core 2 Duo处理器已经正式发售,Core微架构的威力已不再是只能远观而不能实际感受的事情。Core微架构的威力确实十分强大,Core 2 Duo的性能已经可以对AMD的处理器形成绝对优势。时至今日,AMD已经无法凭借已显老迈的K8再度在市场驰骋,传闻中足以与Core微架构抗衡的K8L也只是待字闺中,何时可以出世还是未知之数。如果AMD不及时拿出具有实质性改变的产品,就凭“吃老本”来和Intel新一代的Core 2 Duo处理器正面竞争,将面临着非常被动的局面。



从技术角度上看

首先,处理器微架构方面,从939的K8小修小补升级而来的AM2远远落后于Conroe,甚至可以说现在的K8架构与Conroe的Core微架构相差有一代的距离。虽然有不少AMD的Fans认为Intel放弃Netburst的以超长流水线达到高主频的设计而采用Core的短流水线以提高处理器工作效率的设计是抄袭AMD的K8架构,但个人认为Core微架构更多来说是源自P6微架构的基础上进行很多重大的改变而得到的。相对于之前的设计,Core微架构为加强指令的处理能力,改进了编码器和算术逻辑单元。而在这当中也加入了一整套的创新功能。如宽动态执行(Wide Dynamic Execution)、宏融合(Macro Fusion)、微操作融合(Micro-op Fusion)等等。宽动态执行和微操作融合都是从前代架构继承过来然后加以改进优化的技术,至于宏融合是最新加入的,通过合并普通指令的方式减少指令的执行时间。以上3项技术都是Core微架构优化指令执行效率的设计精髓。而共享的智能二级缓存、智能内存访问等技术也是新加入到Core微架构的技术,这些技术都使Conroe处理器的性能发生了质的飞跃。与Intel在微架构上大刀阔斧的改革,AMD在升级接口界面的同时几乎没有对原有架构做出任何改变,这不禁让众多对其充满期望的用户大为失望。虽然AMD的据说可以压制Core架构的K8L架构正在研发,但实际上到何时才能面世毕竟还是未知之数,用户即使期待但是不免有人受不住Conroe的诱惑,相信这样的人并不在少数。如果AMD不加速新架构的开发,必然会使AMD陷入极大的困境,无力继续和Intel抗衡。



其次,性能最强的王座不再属于AMD。踏入K8时代以来,AMD凭借K8的优秀架构把性能最强的宝座从Intel手中抢过来至今已经有将近两年的时间。尽管在多媒体处理方面还是落后Intel不少,但在浮点运算能力和实际游戏性能,同档次的U相比AMD具有一定的优势,尤其是游戏性能方面。这在3DMark的排行榜上可以很明显的看到,在扣肉没有出来之前,几个版本的3DMark排行榜中前10名基本上都是AMD的旗舰级CPU搭配SLI或者Crossfire取得的,Intel的U能够挤进前十的实在是少之又少。而高端的游戏平台更是几乎采用清一色的AMD处理器。但这一切在Conroe面世之后被迅速改变,3DMark排行榜上不断出现Conroe的身影,直至现在AMD的排位几乎全部被取代。而AMD一向引以为傲的强大浮点运算能力在Conroe面前也有些吃不消了。目前AMD的旗舰产品FX62再怎么超频跑1M的supper PI也不能跑进20秒,而Conroe则已经把记录推进到10秒以内,其运算能力的强大以非AMD的U可比。AMD的处理器性能虽然还在增强,但K8架构已经不足以使CPU的性能取得质的飞跃,性能宝座只能拱手相让了。

第三,AMD也逐渐放弃高性价比的路线。从K7时代开始AMD一直以高性价比而著称,当年的Barton 2500+可以说是性价比之王,超频性能极强,基本上都可以不加压稳超3200+,性能甚至可以媲美当时Intel最强的CPU,而这样一款产品在当时热卖时的售价甚至低至450元左右,只是相当于Celeron处理器的水平。不过随着处理器的发展,这样的产品也是越来越少,甚至当时的Barton 2500+在停产之时在市面上的售价上升到接近800元,性价比已经大打折扣。随后的K8,AMD虽然取得了性能最强的地位,但是售价却一直居高不下,性价比已经与AMD渐行渐远。但还是有极多玩家看重AMD的强大性能和较低的功耗,即使性价比不算太高仍然选择了AMD,包括我自己。但AMD似乎越来越让玩家失望,Athlon 64 X2的高价上市更是伤透了AMD Fans的心,尽管X2的性能比Pentium D要优秀不少,但还是性价比还是无法再和AMD联系起来。虽然Conroe推出之后AMD迫于压力也大幅降低售价,争回了不少AMD旧Fans的回头,但这似乎为时已晚,越来越多用户投向Intel的怀抱,选择超频能力和性价比更高的Intel处理器。如果AMD再不反省K8时代的高价行为,只会有越来越多的用户抛弃AMD,转投Intel怀抱。


此外,产能不足和良品率低下是AMD永远的痛。往前两年,个人电脑的普及率还不是太高,AMD的市场占有率也没有现在高。尽管产能不足,但AMD仍然可以满足市场的需求。但到K7时代后半期,AMD开始热卖,产能不足的问题开始慢慢浮现出来,市场上不时出现一U难求的状况,这让不少希望选择AMD的用户只能转投Intel裙下。到K8时代这一问题的严重性进一步暴露,热门产品经常缺货,有价无市是家常便饭。此外曾经有大批ES版的处理器流入市场一方面反映了AMD的良品率低下,也从另一方面暴露了AMD在渠道管理方面的能力不足。AM2处理器的大量上市似乎暂时掩盖了AMD这一伤痛,但几乎所有工厂都在以超过设计产能150%的强度在运转,AMD苦苦支撑着这一局面,可以支撑多久还是一个未知之数。


还有一点,就是CPU的功耗问题。虽然AMD在CPU功耗方面一直做得不错,新的AM2 Athlon 64处理器的TDP也控制在65W左右,但双核的X2的TDP却达到了95W,旗舰级别的FX-62的TDP达到了惊人的125W,和Pentium D 955XE处在同一水平。而Intel在全面转向65nm制程之后,加上先进的Core微架构,新的Conroe处理器的TDP被控制在65W,即使是旗舰级的Core 2 Extreme X6800的TDP也只是75W,远小于FX-62的125W。火炉已经不再是Intel所有,现在的AMD似乎更适合这一称呼了。除了性能性价比之后,温度功耗控制这一长处也逐渐离AMD远去。AMD在制造工艺上的投入与Intel相差甚远,在Intel全面转向65nm工艺之后AMD还是只能守着90nm工艺进行生产,这也是制约AMD发展的一个痛处。

从K7的辉煌到K8的称霸,AMD在这几年走得可以说是顺风顺水,对Intel的压力也越来越大。不过在辉煌的背后,AMD似乎在逐渐走向低潮。Intel在经历了两年的蛰伏之后终于发力,凭借强大的Core微架构向AMD发起了进攻。无论是技术还是性能上,目前的AMD都处于劣势,AMD所面对的,可能是这几年以来最大的困境。

爱问(iAsk.com)



硬件论坛】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭




科技时代意见反馈留言板 电话:010-82628888-5595   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2006 SINA Inc. All Rights Reserved

新浪公司 版权所有