问鼎显卡性能之王 NV旗舰GTX280详细评测(7)

http://www.sina.com.cn 2008年06月17日 09:30  太平洋电脑网

  1.6 Texture和math-相互没有关联的多线程操作

  Texture寻址、过滤和fetching都会耗尽相当多GPU的核心时钟。如果在架构需要在一个数学操作之前进行Texture的操作,例如是16x各向异性过滤,系统的延时将会大大增加。Geforce8800 GPU作出重大的改进,在进行相当的独立算术运算的时候,“隐藏”了Texture fetch的延迟。

问鼎显卡性能之王NV旗舰GTX280详细评测(7)

  在Geforce7系列的GPU中,Texture寻址计算是采用隔行扫描进行的,这种设计在遇到texture fetch的时候就会遇到瓶颈。Geforce8800 GPU可以完全独立的进行texture操作和shader算术运算。

问鼎显卡性能之王NV旗舰GTX280详细评测(7)

  在Geforce8800架构开发的初期,NVIDIA工程师分析了数百种包含越来越多的标量计算的shader程序以后发现,一些混合了矢量和标量的指令,特别是一些比较长的shader很难有效的在矢量的架构中处理操作。标量计算在矢量的流水线中编译非常困难。

  NVIDIA和ATI的都可以处理两个指令,在R580中,ATI采用的3+1架构可以处理一个2x2的矢量指令和由1x3矢量指令和1x1标量指令的混合,在Geforce6/7中,可以操作2+2和3+1的双指令操作。但是这些跟Geforce8800 GPU的标量设计那么高效。NVIDIA的工程师作出评估,128个标量处理器的标量架构拥有两倍性能于32个复合的矢量处理器架构。

本文导航:
·市场分析
·Geforce8800采用Unified Shader架构
·传统Pipeline模型 VS Unified Shader模型
·为什么需要Unified shader架构?
·G80里面的核心部件-Streaming Processors
·Geometry shader(几何着色器)
·Texture和math-相互没有关联的多线程操作
·Early-Z技术
·G80的填充率计算
·G80的ROP(Raster Operation partitions)
·GT200架构特点:提高性能同时提升了效率
·优化的shader/TF比值 适应未来的需求
·提升几何着色器及数据流输出的表现
·加倍的寄存器文件
·升级ROPs(光栅化处理器
·提高了纹理表现
·并行处理架构:GPU将比CPU更主要
·面向未来:CUDA应用方向1
·面向未来:CUDA应用方向2
·面向未来:CUDA应用方向3
·面向未来:CUDA应用方向4
·面向未来:CUDA应用方向5
·面向未来:CUDA应用方向6
·GTX280:最先进的物理特效
·新的代言人:美杜莎DEMO欣赏
·最强DX10显卡GTX280揭秘1
·最强DX10显卡GTX280揭秘2
·GTX280内部结构惊人1
·GTX280内部结构惊人2
·正式版GTX280显卡鉴赏
·映众GeForce GTX 280鉴赏
·影驰超频版GTX280鉴赏
·丽台GTX280显卡鉴赏
·盈通GTX280显卡鉴赏
·评测平台及评测方法简介
·3DMarkVantage测试成绩对比
·对比评测-3DMark06性能评测
·《孤岛危机》Crysis性能对比评测
·英雄连《Company Of Heroes》性能对比评测
·DX10游戏对比评测:《ASSASSINS CREED》
·DX10游戏性能评测:《冲突世界》
·DX10游戏性能评测:雷快艇:海洋骑士
·《使命召唤4》Call OF Duty 4对比测试
·《半条命2:第二章》详细对比评测
·《极品飞车11》性能详细对比评测
·《虚幻竞技场3》 详细对比评测
·F.E.A.R性能测试画质设定
·GTX280功耗方面的改进
·评测总结

硬件·台式机每日热点硬件首页 硬件新闻排行榜 台式机首页
发表评论 _COUNT_条
Powered By Google
不支持Flash
·城市对话改革30年 ·新浪城市同心联动 ·诚招合作伙伴 ·企业邮箱畅通无阻
不支持Flash