45纳米T9现身 华硕平台首测T9300 CPU(3)

http://www.sina.com.cn 2008年01月08日 06:00  中关村在线
[笔记本报价] [笔记本新品] [笔记本行情] [笔记本论坛] [笔记本大全] [笔记本频道]



·改变并不只限于45纳米的制程

·劳苦功高的SSE多媒体指令集

    众所周知,在第一代多媒体指令集MMX被推出以来,几乎每隔几代处理器英特尔都会对其内置的多媒体指令集进行更新。而目前英特尔的第五代Streaming SIMD Extension 4(SSE4)指令集除扩展Intel 64位指令外,还新增对于影像编辑、视讯编码、三维渲染以及游戏应用等方面的指令,使得处理器的效能更进一步。


45纳米T9现身华硕平台首测T9300CPU(3)
新一代SSE4多媒体指令集

    本次升级的第五代SSE4多媒体指令集将分为SSE4.1以及SSE4.2两个版本,而这次Santa Rosa Refresh平台所升级的Penryn处理器则使用了其中的SSE4.1指令集。更新后的SSE4.1多媒体指令集共增加了47条指令并且引入了两组不同的32-bit向量整数乘法运算单元能够对八位无符号最大值以及最小值运算提供支持。另外新加入的16-bit/32-bit有符号和无符号运算支持,能够有效改善编译器执行效率并提升向量整数以及单精度代码的运算能力。

45纳米T9现身华硕平台首测T9300CPU(3)
SSE4.1多媒体指令集共增加了47条指令

    不仅如此新加入了6条浮点型点积运算指令的SSE4.1已经能够对单精度、双精度浮点运算及浮点产生操作提供支持,且额外的IEEE 754指令(包含Nearest、-Inf、+Inf、与Truncate) 也可以保证转换路径模式立即运行,在减少了系统延迟时间的同时也对3D应用给与了极大的便利。

    得益于以往SSE多媒体指令集的优势,处理器在视频编码上也颇具优势。本次的SSE4.1多媒体指令集中增加的串流式负载指令,能够提高图形帧缓冲区的读取数据带宽,可以在理论上获得更加完整的缓存行并以64字节的数据线宽读取显卡帧缓冲区,相较以往的8字节架构有很大程度的速度提升。

·超级Shuffle同样功不可没

    仅仅拥有新的多媒体指令集仍旧不够,Penryn处理器内置的超级Shuffle引擎和SSE指令集能够相互关联,使多媒体指令运算效率获得较大幅度的提升。

45纳米T9现身华硕平台首测T9300CPU(3)
超级Shuffle引擎效果惊人

    以往在处理128位宽度的字节、字以及Dword SSE数据时,处理器并不能将这些整合在单一周期内运行,必须将一个128位数据拆成2个64位进行处理器,当然再加上处理数据的时间则一共需要2个周期。但超级Shuffle引擎设计可以允许处理器在不经过软件部分改良的基础上将多种性质的128位SSE指令放在1个周期内完成。

·除法器更新配合二级缓存分组

·新一代Radix-16处理器赋予Penryn更快的速度

    在拥有酷睿架构的一系列优点之外,新的45nm Penryn处理器进一步的改良了除法器的设计,对比早先的产品提升了约2倍左右的性能。新的除法器被称为“Radix-16”,对比以往的Radix-4或者Radix-2除法器,后者在单一周期内只能传递2bit数据,而新的快速Radix-16除法器则可以传递4bit数据。


45纳米T9现身华硕平台首测T9300CPU(3)
新一代除法器:Radix-16

    也就意味着Penryn处理器能够达到单周期处理多达4个指令,并且14层流水线设计也提升分支预测的能力及准确性,分支预测的带宽提升至20byte (K8、Banias 为16byte,Netburst为4byte),令指令执行效率大大提高。新的Radix-16除法器在大幅改善宽位动态执行的效率的同时,也在加速浮点以及整数的除法运算速度,在针对科学计算、数学运算以及3D坐标的转换中有着较大程度的提高。

  说到快速操作系统原语支持是指,当操作系统遇到临时阻碍、遮蔽中断指令且影响关键代码区段,或者是类似输入输出设备需要独占存取等情况的时候,处理器可以快速的中断遮蔽控制机能,清除以及重置中断,并快速进、出此状态模式,大幅改善该类型操作。基于此,Penryn可以快速执行XCHG、ADD、XADD、NEG、BTS、AND、CMPXCHG等锁定指令,以及快速存取读取时间印记计数器。英特尔称:快速操作系统原语支持技术可提高2倍的执行效率,对数据库服务器、交易处理服务器等应用有特别明显的性能提升。Intel经由强化微架构设计,缩短VT-x指令转换虚拟主机进入、离开时间,无须修改现有虚拟主机软件,就能增加25%~75%的执行效率。

·小群组拥有大能力,Associativity技术大幅提高缓存命中率

    对于处理器另一个重要的部分,相信很多资深的DIY玩家会选择其高速二级缓存。对于处理器来说,高速二级缓存是介于处理器与系统之间的一个缓冲区,处理器会对缓存内的数据进行预读以提高程序及指令的运行效率。新的45nm Penryn处理器在高速缓存上加入了一种“小群组”概念并称其为“Associativity”,该技术将高速缓存分割成多个区块。这样做的好处是可以加速数据读出以及写入,而不用在容量日趋增大的缓存中对数据进行查询。

45纳米T9现身华硕平台首测T9300CPU(3)
Associativity技术将缓存分组

  由于这种小群组的个数跟快取失误率及额外的延迟时间有关,所以小群组的数量越多便能够降低数据覆盖的几率,减少快取失误几率从而提高命中率。相比以往的16路设计,Penryn处理器在此基础上增加到了24路,以目前Penryn处理器的二级缓存数量来看,理论上可以更加进一步的降低失误率。

    需要说明的是,这种“Associativity”也是一柄双刃剑。处理器会因为缓存中小群组数量过多,会逐一的按照群组对数据进行查询,这样的后果就是延迟时间不但不会缩短,反而会变得更长。

45纳米T9现身华硕平台首测T9300CPU(3)
采用Associativity技术后的缓存效果增长

    另外在本次推出的5款Penryn处理器中并不是所有的型号都具备有24路Associativity技术,其中内置有3MB缓存的Core 2 Duo T8100与8300就只有12路Associativity,而二级缓存为6MB的T9300与9500才拥有24路组联。

[上一页] [1] [2] [3] [4] [5] [6] [下一页]

本文导航:
·Santa Rosa Refresh崭露头角
·45nm的关键High-K+Metal Gate新材质
·改变并不只限于45纳米的制程
·深度睡眠更加省电
·PCMark05与3DMark06测试
·编码测试与最终使用总结

笔记本产品排行 热门手机排行 DC行情速查
5000元以下更多 5000-7000元 更多 7000-10000元更多 10000元以上 更多
发表评论 _COUNT_条
Powered By Google
·《对话城市》直播中国 ·新浪特许频道免责公告 ·企业邮箱换新颜 ·邮箱大奖等你拿