不支持Flash

AMD原生四核CPU架构详解(3)

http://www.sina.com.cn 2007年03月12日 11:20 太平洋电脑网

三、SSE、浮点性能翻倍-全面增至128位

  Barcelona一项重要的改进就是AMD反复宣传的128位SSE执行位宽。在K8构架中,AMD虽然做到了双路SSE执行单元,但这两个SSE执行单元位宽仅是64位,这样在处理大量的128位SSE指令时,K8芯片就需要先把128位SSE、SSE2、SSE3中的矢量指令分解为两个64位宏指令,然后由其64位SSE执行单元分别处理再合并,这对处理器的性能是有较大的损失的。在Barcelona拥有128位的SSE执行位宽后,128位的SSE指令就不再需要分解再合并,而是直接运算,这大约只需要过去的1/3的执行时间,效率大为提高。同样,浮点调度单元也扩展到128位,在前文中已详细描述,目前可以肯定的是128位的浮点运算单元和调度单元将至少使K8L构架处理器在FPU、向量SSE数据的分派、传输、解码速度三方面同时达到现有K8构架同频率处理器的两倍速度。

AMD原生四核CPU架构详解(3)

  增强了SSE性能之后,Barcelona拥有了比K8芯片强大2倍的SSE处理性能,同时AMD也发现16位的取指令单元位宽已经成为了一个新的性能瓶颈。于是K8构架的16位取指令单元位宽也适应时代的改进为32位,这样瓶颈问题就得到了解决。在拥有了强大的执行单元后,接下来要做的就是确保及时输入足够的数据,AMD在此将L1缓存至执行单元的位宽由双路64位增强为双路128位。同样L1缓存至L2缓存及内存的位宽也同样增强到128位。

AMD原生四核CPU架构详解(3)


  128位SSE执行单元的改进与INTEL由Yonah至Merom/CORE的改进相类似。两年前,我们曾在评测中将Yonah芯片和K8芯片运行在同一频率,结果说明Yonah的视频编码性能大幅落后于K8。虽然Yonah相对上一代的Dothan已经在SSE性能上改进了不少,但直到CORE构架的改进完成,Pentium M构架体系才真正在SSE性能方面超越了AMD的K8构架。无论是其128位SSE执行单元位宽、128位的前端接口,CORE构架的解码能力当时都大副超越了K8构架。

  在前文中,我们已经介绍过AMD在K8L构架的浮点运算器方面进行性能翻倍的改进:FADD、FMUL及SSE等浮点运算器将由64位扩展到128位。同时,K8L构架的两条浮点数据传输带宽也加宽到128位,使得处理器可以与L1缓存进行128位的高速传输。相比只拥有一条浮点数据传输带的CORE构架,K8L将有一定的优势。同时,K8L构架在浮点FADD和FMUL中也将拥有128位的ADD/MUL块处理能力来面对SSE2数据。在K8构架中FSTORE单元所存在的传输及运算法则缺陷等问题也将在K8L中得到改进。K8L构架的浮点运算能力将至少比K8构架快一倍,甚至比当前最强大的CORE构架处理器还要快10%,尤其在处理没有SSE优化的X87数据时,K8L构架芯片将比CORE构架芯片快50%以上。

[上一页] [1] [2] [3] [4] [5] [6] [7] [8] [9] [下一页]

本文导航:
·英特尔力挽狂澜 K8构架终谢幕
·K8L构架-首款原生四核心CPU
·SSE、浮点性能翻倍-全面增至128位
·K8软肋不再-分支预测器的重要改进
·伐指令优化器、乱序执行、SSE4等新特性
·内存控制器与预取器
·32路L3缓存首次进入桌面CPU
·智能功耗控制-核心及北桥独立供电
·告别K8构架 AMD三巨头引领新时代

发表评论
爱问(iAsk.com)
不支持Flash
 
不支持Flash
不支持Flash