英特尔新任首席架构师:CPU GPU分久必合
http://www.sina.com.cn 2007年04月16日 15:15
IT168.com
前言
目前负责Intel的GPU开发计划的Douglas Carmean是当前Intel可视化计算群组(Visual Computing Group,简称VCG)新任首席架构设计师,他在几个大学进行了题为“未来CPU架构——源于传统模型上的转变”(Future CPU Architectures -- The Shift from Traditional Models)。本文以Carmean先生的主题演讲PPT为主要内容,向各位读者介绍Intel未来的发展策略,以及正在酝酿中将在未来世代打响的CPU与GPU对决战。
|
|
未来CPU的架构——源于传统模型上的转变
Doug Carmean |
|
|
Intel CPU 30年发展回顾
- 1985年,80386,32位微处理器架构;
- 1989年,80486,整合的FPU浮点运算单元;CPU片内集成高速读写缓存;
- 1992年,Pentium,双CPU同时运行;指令分支预测功能;
- 1995年,Pentium Pro,引入乱序执行机制;
- Penium Pro引入了P6微架构,在此基础上Intel进行了14次重要的架构改进。
|
|
|
- CPU的利润空间越来越小
- GPU的利润空间正在增长
- 半导体工业正在酝酿一次革命
|
在回顾了过去30年的CPU发展历程后,Carmean认为CPU当前的发展空间受到了限制,而GPU则正在以更快的步伐发展。“利润”始终是商业世界里面最重要的一个名词,但下一个利润增长点又在何处?
|
|
Stream Computing(流运算)
- 基于GPU上的通用计算(GPGPU)
-解放GPU巨大的浮点运算潜力 -比通用CPU快一个数量级的浮点运算性能
- GPU架构可支持
-32位FP着色 -Long编程(可支持65535个指令)和Shader编程 -Branching(分支)和looping(回调)编程结构
- 缺少应用软件是普及的障碍
- 释放GPGPU威力的关键:Close To Metal(简称为CTM)新型瘦硬件接口层
|
|
|
CUDA架构和GPU计算——NVIDIA
- CUDA是针对在GPU上实现通用计算所提出全新架构和编程模型
- 硬件和软件的协同化设计
-并不是为旧的GPU架构提供的新驱动程序
- 通过上千个线程实现数据并行计算
- 密集型大规模的数学运算因并行数据缓存而获益
- 基于C语言的编程方式
- 专门的BLAS(稀疏矩阵)和FFT(快速傅立叶变化)计算库
|
|
|
计算的演进:充斥这矛盾和冲突的过程
CPU:
GPU:
- 发展方向:通用计算
- 以高质量图形效果和通用计算GPU(GPGPU)为目标
|
|
|
针对耗能效率的优化
通过显式并行性实现能耗效率的优化
- VLIW(Very Long Instruction Word,超长指令集架构)和Vectors(向量,译者注:可以将多个短指令按照向量的方式进行组合执行,实现单周期执行多指令的一种方法):
-在严格同步执行时占优 -不适合数据依据不同路径进行处理的情况
- Threads(线程,译者注:线程是一种共享资源式的同步机制)
-不适合严格同步执行的情况 -在数据依据不同路径进行处理时占优
实际上是
- 指令向量的效率随其长度增加而下降
- 线程的效率随着程序通信的增加而下降
|
NVIDIA和ATi的GPU越来越像是“谋朝篡位”者了,自2001年DirectX 8时代的NV20起,现在的GPU可编程计算能力已经得到了大幅度的提升,甚至已经引起了Intel方面的注意。有趣的事情:Carmean先生的这个主题演讲PPT最初的版本首次出现在2005年,而2005年底就已经风闻AMD准备并购ATi了。
译者注:任何事情都不可能空穴来风,2005年时的传闻现在已经成为现实,整合ATi之后,GPU设计已经成为AMD的重要技术内容,而未来AMD的计划可以用“CPU+GPGPU”来概述,Intel面对这样的威胁自然是不敢怠慢。Intel是否应该拿出自己的GPGPU,或者是设计类似GPGPU的CPU来面对来自AMD的挑战?