科技时代新浪首页 > 科技时代 > 硬件 > 正文

英特尔的屠龙刀 新一代Conroe处理器性能评测


http://www.sina.com.cn 2006年07月28日 19:01 天极yesky
天极评测室Oscar  “速龙”、“散步龙”横行,英特尔祭出屠龙新刀

  在1993年Intel首次将自己X86的产品命名方式改为Pentium以来,至今已经有13年,虽然其间经历了Cyrix、IBM、IDT、UMC、Rise、AMD等公司的挑战,但Pentium处理器13年来还是以最强的性能,代表着各个时代处理器发展的最新进程。在当时谁也没想到Intel13年以后最大的挑战竟不是来自当时最强势的Cyrix、IBM,而是一家以生产兼容80186、80286处理器起家的AMD。

  AMD在并购了当时的一家处理器厂商NexGen后,利用NexGen技术成功让自己从CISC处理器核心进化到高效能的RISC核心,一举击败了竞争对手Cyrix、IBM、IDT、UMC、Rise,成为在规格、效能上能与Intel正面对抗的处理器制造厂商。在之后AMD又推出了K6处理器,在效能上有更进一步提升。而后的K7 Slot A规格产品则开始以Athlon(速龙)命名,成为Pentium3唯一的对手,随后又推出了Socket 462的Athlon XP、Duron(毒龙)与Pentium4、Celeron竞争。这些K6、K7处理器虽然都取得了不错的成绩,但这只不过是AMD公司的一个积累过程,真正谋划长远的是开发代号为K8的超级武器。

  当采用K8全新构架的Athlon64、Athlon64 FX、Opteron处理器携同X86-64指令集发布时,立即震惊了全世界,所有人的目光焦点都转移到AMD K8体系的64位运算、整合内存控制器等崭新特性上,AMD这次划时代的进步确实严重的创伤了处理器龙头Intel,市场占有率节节攀升,并实现了多年来的首次盈利。使Intel不得不把Pentium4处理器的价格往下一调再调。而随后展开的“双核”战中,K8构架的Athlon64 X2更是把PentiumD系列修理的体无完肤,更让Intel颜面无存的是AMD曾多次公开叫嚣要与Intel对比双核处理器性能,可以说在本文主角Conroe推出之前,是一个“速龙”、“散步龙”横行的白垩纪时代。

英特尔的屠龙刀新一代Conroe处理器性能评测

  在地球史册上,终结那些霸王龙、翼龙的是一颗来自外太空的巨大陨石,而在现在这个“速龙”、“散步龙”横行的新白垩纪时代,Intel可不能指望着有来自外太空的陨石来灭绝这些让人头痛的“速龙”、“散步龙”,只能韬光养晦自己磨制一把绝世的“屠龙刀”(Conroe)。这把屠龙刀早在金庸小说里已经有记载“屠龙刀厚重,倚天剑轻盈,两种神兵有其一者足以纵横天下”,看来Intel很了解“工欲善其事,必先利其器”的道理。那么Intel这把神兵利器有何能耐砍杀那些“速龙”、“散步龙”呢?下面我们就来看看屠龙刀的五大过人之处。
绝杀之一:Intel Wide Dynamic Execution

  在介绍Conroe这把屠龙刀的特性之前,记者还是想先来谈谈这把屠龙刀的设计理念。虽然我们可以看到Conroe是一把很复杂的神兵利器,不过其设计理念确可以用简单的两点来主要概括:一、高效能;二、低功耗。与以往Netburst构架的P4处理器所提倡的高频率就等于高效能理念不同,Intel终于认同了Cyrix、IBM、AMD在十几年前所提出的“频率并不等同于效能的理念”,开始注重构架内效能的改进,让处理器能在同一时钟周期内可以执行更多的指令。而另一个设计原则是低功耗,上一代的Presscot核心P4曾把功耗飙高的130W,令整套系统在解决散热问题方面煞费苦心,普通用户对于Presscot核心产品的高发热更是怨声沸腾,因此这次Conroe除了要在效能上有所提高为,还必须要解决用户关注的高发热问题。

英特尔的屠龙刀新一代Conroe处理器性能评测

  Intel Wide Dynamic Execution是Intel居于提高效能的原则上设计出来的架构,旨在让处理器在一个时钟周期内处理更多的指令,以此来达到降低频率提高效能的目的。Intel的Wide Dynamic Execution是通过5项设计来做到,第一,是采用14层的作业流水线设计,与Presscot高达31层的做业流水线相比,14层的作业流水线可以更好的配合低主频的处理器,在处理器出错时可以降低修正、重新编译的时间。

  第二Deeper Buffers是指配合14层作业流水线所设计出的错误预测机制的带宽变大了,因为netburst架构下的错误预测机制的带宽仅为4B,而到了Core MicroArchitecture下带宽则曾加到20B,Core MicroArchitecture在仅有14层作业流水线的情况下还采用20B如此Deeper Buffers的错误预测机制,而netburst架构下31层的作业流水线长度才采用了4B Buffers的错误预测机制,相比之下可见Core Architecture下改进之大。第三项的4Wide Decode to execute是指Core MicroArchitecture拥有4组Decoder,比netburst的3组Decoder要多出一组,可以在同一时钟周期内达到更快的处理速度,下面的4Wide-Micro-ops execute则是在反映4Wide Decoder的处理性能。

英特尔的屠龙刀新一代Conroe处理器性能评测

英特尔的屠龙刀新一代Conroe处理器性能评测

  Macro-Fusion也是Intel Wide Dynamic Execution理念下开发的一种机制,要理解Macro-Fusion的概念前我们需要先来看看之前没有Macro-Fusion的指令执行机制。首先我们来设定处理器中只有4个Decode,然后利用这4个Decode从存储有5个指令的指令队列中拾取进行并行处理,那么这套机制一次最多只能4个指令长度,要完成指令队列中5个指令长度的运算需要两个时钟周期。

  运用Macro-Fusion设计的好处就是可以把原来需要两个时钟周期处理的5个指令长度,缩短为一个时钟周期内处理完成。在只有4个Decode不变得情况下,需要一个时钟周期内处理5个指令长度的运算,那只能是先把可以合并处理的两个指令先熔合为一条指令再送抵Decode去处理,而合并指令的这套机制就称为Macro-Fusion。从上面的分析我们也可以想象的到,不是任意的两条指令都可以合并为一条指令再送到Decode来处理的,如果遇到5条指令都不能相互熔合的情况,就算是拥有Macro-Fusion机制的处理器也需要2个时钟周期去处理完成。
绝杀之二:Intel Advanced Smart Cache

  在双核心处理器概念出现的时候,曾有一场AMD与Intel之间的争论,也就是真假双核心之争。在netburst构架下的PentiumD仅是Intel利用自己出色的半导体工艺,把两颗完整的处理器核心封装在一张PCB上,两颗核心之间没有任何片上的通讯设计,仅是依靠FSB总线在北桥芯片内进行交流,这有点类似于工作站产品上常用的SMP多路服务器技术。因此该设计曾被对手AMD贬为“假双核”。IT产业界常有这种企业间的争论,我们也不妨当作是茶余饭后的笑谈,不过这次Conroe的Smart Cache设计可是被誉为真双核的典范。

英特尔的屠龙刀新一代Conroe处理器性能评测

  与之前Netbusrt构架下类似SMP的双核心设计相比,Conroe上的Smart Cache设计则可以允许两个核心共同使用同一个L2 Cache,使得两个核心间的数据交流不必再像之前一样通过FSB绕到北桥再拐回来访问另一个核心的L2 Cache,而是可以直接在共享的L2 Cache空间内拾取,这是Smart Cache设计带来的降低延迟方面的好处。

  Smart Cache设计的另一个好处是提高资源的利用率,在多台相同的设备协同工作的时候,我们不可避免的一个问题就是负载平衡。处理器从单核发展多双核也就多出了负载平衡的问题,要做到很好的负载平衡这绝不是处理器硬件机制一方面的问题,还需要操作系统和应用软件的同时配合,在复杂的应用环境中处理器两个核心间工作量分配不均是很常见的问题,这时候提高整个处理器内部的资源占用率就成为提高系统处理速度的关键。

  我们相信在处理器应用的大部分时间,Conroe是工作在负载不均的情况下的,这时候就会导致一个核心闲置,另一个核心高负荷的情况。Smart Cache的设计则可以让高负荷的核心占用更大的空间来进行快速存储,提高整体系统的处理速度。

英特尔的屠龙刀新一代Conroe处理器性能评测

  通过在系统内部增加更多可共享的部件是可以有效的降低延迟、提高资源利用率,因此Intel的这一代Core Micro Architecture将会被笔记本上的Merom移动处理器、服务器上的Woodcrest至强51XX系列产品所采用。
绝杀之三:Intel Smart Memory Access

英特尔的屠龙刀新一代Conroe处理器性能评测

  Smart Memory Access是根据提高效率的原则来开发的技术,旨在提高数据存、取的效率。Smart Memory技术是通过建立更多的预取器及一项Memory Disambiguation机制来实现该设计初衷。

英特尔的屠龙刀新一代Conroe处理器性能评测

  在介绍Memory Disambiguation机制之前,还是照惯例来看看没有Memory Disambiguation的数据存取情况。在之前数据的存取是按指令队列的先后顺序来进行,设立这样的先后顺序是有其原因的,就如上面没有Memory Disambiguation的示意图中的1、2两个步骤,首先是需要步骤1把Y这个数据存到内存中,步骤2才能到内存中找到数据Y,并把数据Y取出来,如果没有建立先后的指令顺序,让步骤2先执行这是一定会报错的,避免出错就是顺序执行的好处。

英特尔的屠龙刀新一代Conroe处理器性能评测

  但我们再仔细分析上面没有Memory Disambiguation的示意图的4个步骤,除了步骤1与步骤2是有关联的外,步骤3、与步骤4之间并无任何关联,也与步骤1、2无关。倘若系统急需Load X这个数据,而按照指令队列顺序来执行的话,那么就得等到前面的三个步骤都执行完了之后才能执行,而步骤4明明就与前面的三个步骤无任何关联,系统就会白浪费三个周期的等待时间。Memory Disambiguation机制就是可以通过乱序线程,把并无前后关联而又是系统紧需的指令第一时间执行,不让系统可以无需等待继续运行。
绝杀之四:Intel Advanced Digital Media Boost

英特尔的屠龙刀新一代Conroe处理器性能评测

  Intel Advanced Digital Media Boost所该进的就比较容易理解了,就是在之前64bit整数、浮点数运算能力的基础上,加强到128bit的整数、浮点数运算,在处理128bit的SSE数据的时候较之前有快一倍的优势。
绝杀之五:Intel Intelligent Power Capability

英特尔的屠龙刀新一代Conroe处理器性能评测

英特尔的屠龙刀新一代Conroe处理器性能评测

  虽然Intel半导体制造部门拥有世界上最先进的半导体制造技术,可以造出世界上频率最高处理器,但是处理器频率越高就代表着发热更高、耗电量更大,Presscot核心处理器已经让世人领教了什么叫吃电怪兽。现在Intel已经认同了“频率不等于效能”的看法,真正需要去做的是在低频率下产生高效能,而不是在高频率下产生低下的效率。

  为了让处理其可以更省电,Intel开发出了EIST(Enhance Intel Speedstep Technology)节电技术,从EIST的命名上就可以猜测到EIST是IST的增强版。除了在IST的基础上根据半导体在不同的电压下有不同的工作频率的特性,来根据处理器的使用情况两段式的控制处理器工作频率、电压达到省电的目的,EIST做为IST的增强版加入了高级电源管理功能,可以关闭核心内部没有处于工作状态的部件,而在于最难实现Cache部分电源管理,EIST则是采用分区域的方法来监控,没有读取的Cache区域则会被关闭。

  虽然通过EIST技术关闭不工作部件可以明显的达到省电、控制废热的目的,但在系统需要使用到被关闭的部件时,重新打开被关闭的部件会否造成延迟则成了另一个问题,为此EIST技术必须建立一套预测机制,在系统需要使用被关闭的部件前对该部件加电,使的省电可以控制在无延迟基础上。
Conroe E6600&E6300处理器实物照

英特尔的屠龙刀新一代Conroe处理器性能评测

英特尔的屠龙刀新一代Conroe处理器性能评测

  Intel这新一代的双核处理器以Conroe来命名,把使用了13年之久的频率制胜论及Pentium这个名字彻底丢弃。Conroe处理器根据TDP电源功耗的不同分为E、T、L、U四个等级,采用E打头的为50W以上产品,T打头的为24-49W产品,L代表15-24W产品,U代表14W以下产品,我们使用的这两颗Conroe E6600就是65W标准功耗的产品。

英特尔的屠龙刀新一代Conroe处理器性能评测

  Core 2 Duo系列目前一共有5款产品,分别为E6700、E6600、E6400、E6300、E4300,其中6字打头的产品全为FSB 1066的产品,而4字开头的E4300则为FSB 800的产品。此外Core2 Duo处理器之间还会有L2 Cache大小的区别,通过我们上面对Smart Cache的介绍,我们大家都应该知道L2 Cache的大小对于Conroe来说有多么的重要,所以如果经费充裕还是推荐大家使用4MB Share Cache的产品。
应用程序性能测试-SYSmark 2004SE

英特尔的屠龙刀新一代Conroe处理器性能评测

英特尔的屠龙刀新一代Conroe处理器性能评测

英特尔的屠龙刀新一代Conroe处理器性能评测

英特尔的屠龙刀新一代Conroe处理器性能评测

英特尔的屠龙刀新一代Conroe处理器性能评测

  通过SYSmark2004 SE中编写的脚本,我们可以很方面的测试出这两款Conroe处理器在办公性能、3D建模、2D建模、数据分析方面的性能表现,从我们上面的测试数据来看,Conroe处理器的这次进步真的超乎我们的意料,在绝大多数的情况下性能都超越了相同价位的同类产品。
多媒体解压缩测试-Divx、WMV9

英特尔的屠龙刀新一代Conroe处理器性能评测

  与WMV-9、H.264一样,DivX是基于Mpeg4开放性构架的一种,其中DivX Converter则是我们平常使用的最多的转码器,其最新版本为DivX Converter6.2。我们测试的方法是使哟国内DivX Converter6.2将一个51.8MB的Mpeg文件转换为DivX格式,测量其耗费的时间,时间越短代表性能越高。从测试的结果来看,在该项目的测试中Conroe E6600是比较优秀的,与E6300有大约13%的差距。

英特尔的屠龙刀新一代Conroe处理器性能评测

英特尔的屠龙刀新一代Conroe处理器性能评测

  Apple公司的iTunes可能是iPOD用户人手一份的音乐转换软件,我们使用iTunes的最新版本iTunes6来把一个wav音频文件转换为160Kbps的MP3文件。然后计算器文件生成时间,所耗费的时间越短越好。从测试结果我们看到,E6600与E6300的差距维持在25%左右。
3D游戏性能测试-Quake4、FEAR、HL2

Quake4游戏测试成绩

英特尔的屠龙刀新一代Conroe处理器性能评测

F.E.A.R游戏测试成绩

英特尔的屠龙刀新一代Conroe处理器性能评测

HL2:Episode One游戏测试成绩

英特尔的屠龙刀新一代Conroe处理器性能评测

  因为对Intel Wide Dynamic Executure机制进行支持,Core MicroArchitecture内ALU都进行了增强设计,这直接导致了Conroe处理器在3D浮点性能上的提升,而该项提升对于3D游戏来说可是有着莫大的帮助。我们可以从上面的测试可以看到3D游戏性能的提升可以说是Conroe最亮眼的改进之一。
宝刀屠龙,武林至尊

  在被AMD K8处理器打压了长时间后,Intel终于可以借助Conroe处理器这把屠龙刀扬眉吐气,一雪前耻。从我们先前介绍的Wide Dynamic Execution、Intelligent Power Capability、Smart Cache、Advanced Digital Media Boost、Smart Memory Access五项重大技术改进来看,Conroe的Core Microarchitecture构架的确在netburst上有脱胎换骨般的改进。而我们在办公性能、多媒体解压缩、3D游戏等各项测试也证实了,这些改进确实有助于产品整体性能的提升,甚至还可以说这些提升令人惊喜。

  武林至尊,宝刀屠龙,号令天下,谁敢不从。Intel有Conroe这把屠龙刀在当前当然是称霸武林,号令天下。我们真的很高兴Intel的设计角度以用户实际使用为出发点,低功耗、低发热、高效能这正是所有PC用户所期盼的。得道多助,望Intel以后的发展不忘时时反省自身,多以用户需求为主,这样才能长久稳坐武林盟主的宝座。

爱问(iAsk.com)



硬件论坛】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭




科技时代意见反馈留言板 电话:010-82628888-5595   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2006 SINA Inc. All Rights Reserved

新浪公司 版权所有