不支持Flash

AMD K10新品全面解析(5)

http://www.sina.com.cn 2007年08月27日 06:56  泡泡网

● Barcelona新特性解析:引入全新SSE128技术

  Barcelona中的一项重要改进是被AMD称为“SSE128”的技术,在K8架构中,处理器可以并行处理两个SSE指令,但是SSE执行单元一般只有64位带宽。对于128位的SSE操作,K8处理器需要将其作为两个64位指令对待。也就是说,当一个128位 SSE指令被取出后,首先需要将其解码为两个micro-ops,因此一个单指令还占用了额外的解码端口,降低了执行效率。

  而Barcelona加宽了执行单元从64位到128位,所有128位的SSE操作不再需要进行解码分解为两个64位操作,并且浮点调度器也可以支持这种128位 SSE操作,提高了执行效率。

AMDK10新品全面解析(5)

  提高SSE指令执行单元带宽的同时,也会带来一些新的变化,也可以说是新的瓶颈:指令存取带宽。为了将并行处理器过程中解码数量最大化,Barcelona开始支持32字节每时钟周期的指令存取,而先前K8架构只支持16字节。32字节的指令存取带宽不仅对处理器SSE代码有帮助,同时对于整数指令也有效果。

AMD Architecture Comparison

 

K8

Barcelona

SSE Execution Width

64-bit

128-bit

Instruction Fetch Bandwidth

16 bytes/cycle

32 bytes/cycle

Data Cache Bandwidth

2 x 64-bit loads/cycle

2 x 128-bit loads/cycle

L2/Northbridge Bandwidth

64 bits/cycle

128 bits/cycle

FP Scheduler Depth

36 Dedicated x 64-bit ops

36 Dedicated x 128-bit ops

  现在你获得了存取和解码更多的指令,而你还需要获得更多的数据送往执行核心,因此AMD还加宽了L1数据缓存和SSE寄存器之间的带宽。

  AMD在SSE128方面的改进非常类似Intel Yonah到Merom的变化。在Conroe/Merom之前,Yonah在浮点SSE方面的表现并不如K8,我们之前曾经对比过同频下Yonah和K8处理器这方面的性能,在一般应用、3D渲染和游戏等测试中,Yonah基本可以和K8打平,但在视频编码方面,K8性能更好。不过在Core 2处理器发布后,AMD K8则不再有这方面的优势。

[上一页] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10]
 [11] [12] [下一页]

本文导航:
·AMD四核9月10日全球正式发布
·简单回顾:AMD一路走来的架构调整
·AMD K10桌面处理器规格/上市日期
·K10是什么?K10微架构又有哪些新特性?
·Barcelona新特性解析:引入全新SSE128技术
·Barcelona新特性解析:512级间接分支预测
·Barcelona新特性解析:堆栈操作与乱序执行
·Barcelona新特性解析:内存控制器再度强化
·Barcelona新特性解析:创新——三级缓存
·Barcelona新特性解析:虚拟化与功耗水平
·Intel与AMD真正的角逐即将正式上演
·未来AMD新一代平台K10+RD790+R600

发表评论 _COUNT_条
爱问(iAsk.com)
不支持Flash
·城市营销百家谈>> ·城市发现之旅有奖活动 ·企业邮箱换新颜 ·携手新浪共创辉煌
不支持Flash

频道精选