横跨未来三年 NVIDIA双面侠GT200显卡测试(3)

http://www.sina.com.cn 2008年06月16日 09:32  IT168.com
GT200的并行运算架构,GPU Computing的基础

横跨未来三年NVIDIA双面侠GT200显卡测试(3)

  GT200的架构称之为NVIDIA第二代统一架构,其主要的运算单元仍然是由数量众多的Streaming Processor所组成的处理器阵列,NVIDIA将这个阵列称之为TPC(Texture Processing Clusters),每个阵列包含若干个SM(streaming multiprocessors),每个SM中Streaming Processor是8个。通过上图我们可以看到GT200一共有10个TPC,每个TPC由3个SM组成,超出G80的8个和2个,每个SM的Streaming Processor core数量和G80一样保持为8个,这样一颗完整的GT200芯片所包含的Streaming Processor数量就是8×3×10=240个,远超G80的128个。

横跨未来三年NVIDIA双面侠GT200显卡测试(3)
GT200并行运算架构

  上图是GT200核心在进行并行运算时的架构形态,处于架构最顶部的是采用硬件设计的线程管理器,用于自动调度成千上万个线程,保持Streaming Processor始终被充分利用。用于3D图形的纹理高速缓存(Tex L2)在这里用来连接TPC与内存(指显卡内存),降低响应时间并提升运算效率。最底部则是8路64bit内存控制器,组成GT200 512bit的内存(显存)位宽。

  在运算形态下,NVIDIA将Streaming Processor称之为Thread Processor(线程处理器),仍然是标量设计,1MAD+2SFU。每个SM的Streaming Processor所共享的缓存为16k,这保证了同一个SM中每个核心能够同其它核心共享数据,而不必通过外部内存,对提升计算速度和增加算法的多样性贡献巨大。

本文导航:
·何为“双面”的GT200?
·GT200的设计目标
·GT200的并行运算架构,GPU Computing的基础
·运算单元的三个重大改进
·全新的概念:GPU Computing
·脱离图形API,CUDA实现对GPU直接调用
·业已融入CUDA的PhysX
·GT200的第二面:图形处理形态
·纹理及光栅单元性能提升
·GT200首发产品规格详解
·GeForce GTX 280实物抢先看
·产品供电及散热细节
·8800GTX\8800GTX\GTX280对比看
·我们如何测试GT200
·BadaBOOM视频转换测试
·DX10理论性能3DMARK Vantage测试
·经典DX9项目3DMARK 06测试
·Crysis跑1920×1200 Very high,GT200仍显疲态
·DX10热门游戏《失落星球》
·DX10最新游戏《鬼泣4》
·openGL经典游戏《Quake4》测试
·支持PhsyX,《UT3》测试
·热门DX9游戏《极品飞车11》
·经典Source引擎《半条命2:第二章》
·DX10级别的RTS游戏《英雄连:抵抗前线》
·唯一DX10.1游戏《刺客信条》
·DX10热门游戏《冲突世界》测试
·热成像仪上阵:GTX280发热详细看
·功耗实测:GeForce GTX 280令人满意
·关于架构
·评测总结

硬件·台式机每日热点硬件首页 硬件新闻排行榜 台式机首页
发表评论 _COUNT_条
Powered By Google
不支持Flash
·城市对话改革30年 ·新浪城市同心联动 ·诚招合作伙伴 ·企业邮箱畅通无阻
不支持Flash