英特尔后发制人 酷睿2移动版力拼双核炫龙 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
http://www.sina.com.cn 2006年09月05日 16:06 小熊在线 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
酷睿2移动版本,Intel后发制人 Intel的最新处理器架构-酷睿2(Core 2)不但先后在服务器/工作站、桌面领域攻城掠池,现在这个按部就班的统一处理器架构计划终于来到了移动平台。移动版本的酷睿2架构处理器和桌面版本使用统一系列的Core 2 Duo Txxxx样式命名,虽然在处理器架构方面Core 2可以看成是移动版本处理器Core一代的延续,在技术上的进步不如企业、桌面领域Core 2相对于Netburst跨越式增长的幅度大,但Core 2仍较Core在保持相当的功耗前提下有着20%的性能提升,Intel也自豪的向外界宣称:Core 2 Duo是世界上最好的移动处理器! 目前Intel发布了5款Core 2 Duo的移动版本处理器,它们分别是Core 2 Duo T7600/T7400/T7200/T5600/T5500。
Core 2 Duo移动版本和Core Duo系列处理器清单 Core 2 Duo移动版本改进了Core Duo不支持64位计算的缺点,并仅以稍稍超过2个季度的发布间隔就大幅度的提升了和上代产品比较的绝对性能。这些使得竞争对手AMD不久前发布的双核炫龙Turion 64 x2处理器短暂的规格优势瞬间消失,和Turion 64 x2相比,后发制人的酷睿2显然更具革命性,延续着Intel移动计算平台良好口碑,市场预期也更乐观。 理解Intel酷睿2处理器架构优势 移动版本的Core 2 Duo产品同样拥有酷睿2的革命性技术,其中用于改善处理器运行性能的包括: 英特尔宽位动态执行(Intel Wide Dynamic Execution)-- 动态执行包含多项技术(数据流分析、预测执行、乱序执行与超标量),这些技术最先出现在Intel Pentium Pro、Pentium II和Pentium III处理器的P6微架构中。在NetBurst微体系架构中,英特尔推出了高级动态执行引擎,一个非常深、用以保持处理器执行单元不断执行指令的乱序预测执行引擎。该微体系结构还采用了增强的分支预测算法来减少分支出错的次数。 现在对于酷睿2微体系结构,宽区动态执行大幅增强了这一能力。它可以每个时钟周期获取、分配、执行和返回达4条完整的指令(三个简单x86指令解码器和一个复杂x86指令解码器);酷睿微体系结构的流水线级数也大大短于NetBurst微体系 架构,只有14级。 Intel在Pentium M处理器中开始引入了微融合(micro-fusion)技术:微融合可以在解码期间将常用的指令对(如条件分支conditional jump后的比较)融合为单个内部指令(微操作),这样2条程序指令就可以作为1个微操作执行,以减少处理器必须执行的整体工作量,增加了给定时间内可以运行的全部指令数量,或者减少了运行一定指令数量的时间。酷睿2微体系结构还包含增强的运算逻辑单元(ALU),以进一步支持微融合。它能够在单个周期内执行组合的指令对,从而使性能得到提升。x86程序指令(微操作)在送往处理器管道解码之前,会被细分为多个组成部分,即微操作。微操作融合将“融合”源自相同宏操作中的微操作,以减少需要执行的微操作数量。微操作数量的减少可使时序安排工作更加高效,从而实现更低的功率和更高的性能,这个技术被称作最新的宏融合(Macro-Fusion)。 英特尔高级智能高速缓存(Intel Advanced Smart Cache)-- 高级智能高速缓存是多核优化的高速缓存,可以通过增加双核处理器每个执行内核从性能更高、效率更高的高速缓存子系统中获取数据的可能性来提高性能。为了做到这一点,英特尔在两个内核之间共享了二级高速缓存。为了解该设计的优势,需要考虑到当前多数多核产品均不能在执行内核之间共享二级高速缓存。这意味着当两个执行内核需要相同的数据时,每个内核均得将其存储在自身的二级高速缓存中。通过英特尔共享的二级高速缓存,数据仅需存储在每个内核均可访问的同一个地方。这使高速缓存资源得到了更充分的利用。通过在每个内核之间共享二级高速缓存,高级智能高速缓存还可以让每个内核动态地利用高达100%的可用二级高速缓存。当一个内核只需要较少的高速缓存时,其它内核便可以增加其占用二级高速缓存的百分比,以减少高速缓存错误并提高性能。 英特尔智能内存访问(Intel Smart Memory Access)-- 英特尔智能内存访问可以提高系统的性能,因为它能够优化内存子系统对可用数据带宽的使用,并隐藏内存访问的延迟。该目标是为了确保能够尽快地使用数据,并使该数据尽可能地用于需要的地方,以将延迟最小化,从而提高效率和速度。 智能内存访问包含一项重要的被称作内存消歧的新能力,该能力提高了乱序处理的效率,因为它可以为执行内核提供内建的智能,以帮助其在执行完所有预先存储的指令前,预测性地载入指令即将需要执行的数据。为了解其工作原理,我们需要了解绝大多数乱序微处理器的情况。通常情况下,当乱序微处理器重新对指令进行排序时,它不能在存储前对载入数据进行重新编排,因为它不了解是否会破坏某些数据的位置关联性。但是在许多情况下,载入数据与之前的存储无关,完全可以提前载入,进而提高效率。问题在于如何确定哪些可以装载,哪些不可以装载。内存消歧使用特殊的智能算法来评估数据是否可以在存储之前进行装载。如果它智能地推测出可以装载,那么就可以将装载指令编排在存储指令之前,以实现可能性最高的指令级并行计算。如果预测性装载最终产生效力,处理器就可以少用一些时间进行等待,将更多的时间用来处理,从而加快执行速度并实现处理器资源的更高效利用。如果装载没有产生效果,内存消歧包含检测冲突的内建智能、可以重新装载正确的数据并重新执行指令。 除内存消歧外,智能内存访问还包含增强的预取器。预取器负责“预取”内存内容,并将其放入高速缓存中,以备读取。增加从高速缓存而非内存的装载量将缩短内存延迟并提高性能。为了让数据位于每个执行内核所需要的地方,酷睿2微体系结构为每个一级高速缓存和二级高速缓存均配置了两个预取器。这些预取器同时检测多个数据流和大跨度的存取类型。这样它们便可以在一级高速缓存中“及时”准备待执行的数据。二级高速缓存的预取器可以分析内核的访问情况,以确保二级高速缓存拥有未来可能需要的数据。 英特尔高级数字媒体增强(Intel Advanced Digital Media Boost)-- 高级数字媒体增强是一项可以显著提高执行SIMD流指令扩展(SSE)指令性能的特性。128位SIMD整数算法和128位SIMD双精度浮点操作减少了执行特定程序任务所需的全部指令数,将能够促使整体性能的增高。SSE指令可以让编程人员开发出混合集合数、单精度数、浮点数和整数的算法,以改进英特尔架构 ,在许多前代处理器上,128位SSE、SSE2和SSE3指令在执行时均采用每2个时钟周期执行一条完整指令的不变速率,例如,一个周期执行下面的64位,下一周期执行上面的64位。高级数字媒体增强特性可以在一个时钟周期完成这些128位指令的执行,从而有效地将这些指令的执行速度提高一倍。通过增加每个周期处理的指令数量,酷睿微体系 结构的整体效率得到了进一步增强。在运行包括图形、视频和音频的诸多重要多媒体操作、以及处理其它使用SSE、SSE2和SSE3指令的数据集时,高级数字媒体增强的作用 尤为明显。
|