作者:范会文
第1页:Intel计划11月11日发布45纳米Yorkfieled
新一轮x86处理器大战即将上演,面对着AMD K10全新微架构产品, Intel将以45纳米制程配合经强化改良的Core微架构应战,为了不让对手重夺技术主导权,Intel防堵大计预将陆续登场! 目前HKEPC分析了Intel未来半年的桌面处理器产品布局,并独家找来全港首颗45纳米四核心Yorkfieled,与上代Kensfield作对比测试。
45纳米四核心Yorkfieled
Intel计划于11月11日发布首款45纳米产品
英特尔45纳米工艺推进计划及制造工厂
据台主机板业者表示,全球处理器龙头Intel将在会在2007年10月第三周正式生产新一代45纳米处理器,并预计在11月11日正式发布首款45纳米产品,首颗45纳米桌面处理器将会是四核心Yorkfield及Xeon DP四核心Harpertown。
据了解,Intel 45纳米处理器样本是由奥勒岗州的Fab D1D试产,但该Fab只是作为45纳米处理器初期研发及试产工作,并无法进行量产,因此Intel 45纳米产品初期将全交由位于亚利桑那州、全新兴建的Fab 32负责生产。
此外,以色列(Israel)的Fab28则预定于2008年上半年投入45纳米生产行列,而奥勒岗州的D1D晶圆厂则进行改建,以符合45纳米量产需求。
根据 Intel 最新桌面处理器规划,首颗45纳米产品将是四核心Yorkfield,预定2007年11月11日面市,紧接着登场的则是双核心Wolfdale,预计2008年1月登场。
45纳米Yorkfield、Wolfdale型号将改变
英特尔新更名法则
Intel早前宣布将会简化产品线命名法则,在2008年1月1日起,把现有Core 2 Duo及Core 2 Quad产品线合并为Core 2,在品牌中不再显示核心数目,只以产品型号中的开首英文作识别,但在各大OEM厂商的反对意见下,Intel最终取消以上决定,因此Core 2 Duo及Core 2 Quad产品线命名法则将会被保留。
此外,为与上代65纳米产品作出有效识别,Intel亦计划采用全新的型号命名法则,四核心Yorkfield型号将编制为QX/Q9000 家族、双核心Wolfdale则命名为E8000家族。
值得注意的是,旧有型号命名法则下,无论是四核心Kentfield及双核心Conroe,其型态第二位数字代表的频率数值是一样的,例如Core 2 Quad Q6600与Core 2 Duo E6600 同样 为2.4GHz 。
但由于Intel 45纳米家族将四核、双核分为不同家族,因此第二位的频率数值将不再相同,例如 2.66GHz的Yorkfield 四核心处理器的型号为Core 2 Duo Q9450 ,但2.66Ghz的 Wolfdale 双核心处理器型号则为Core 2 Duo E8200 。
2007年内仅一款45纳米处理器上市
年内只有QX9650处理器会上市
值得注意的是尽管Intel在2007年11月11日正式发布45纳米处理器,但其象征意义却远大于实际。
据了解,Intel在2007年内仅有1款45纳米处理器上市,型号为Core 2 Extreme QX9650,核心频率仍保持3GHz,支持1333MHz FSB,内建12MB( 6MB x 2 ) L2 Cache ,支持Intel Virtualization Technology 、Intel Enhanced SpeedStep Technology 、Intel 64 Technology 及 Execute Disable Bit ,每千颗单价暂定 $ 999。
Intel 45纳米大军直至2008 年1月份才会陆续登陆作战,暂定将会发布3颗四核心及3颗双核心产品。
3款Yorkfield处理器将会包括Core 2 Quad Q9300、 Q9450及Q9550,核心频率分别为2.5GHz、2.6GHz及2.83GHz,支持1333MHzFSB,除了Q9300仅内建6MB( 3MB x 2 )L2 Cache,其余型号均为12MB( 6MB x 2 )L2 Cache,支持Intel Virtualization Technology、Intel Trust Execute Technology、Intel Enhanced SpeedStep Technology、Intel 64 Technology及Execute Disable Bit,每千颗单价分别为$ 266、$ 316及$ 530。
双核心方面,3款Wolfdale处理器包括Core 2 Duo E8200、 Core 2 Duo E8400及Core 2 Duo E8500将会同时上阵,核心频率分别为2.66GHz、3GHz及3.16GHz,支持 1333MHz FSB,内建6MB L2 Cache,支持Intel Virtualization Technology 、Intel Trust Execute Technology、 Intel Enhanced SpeedStep Technology、Intel 64 Technology及Execute Disable Bit,每千颗单价分别为$ 163、$ 183 及$ 266。
Intel 45nm DT CPU Pricing ( 1Ku ) Q1, 2008
|
Model
|
Speed
|
L2 Cache
|
FSB
|
11-Nov
|
Jan 2008
|
Quad Core
|
QX9650
|
3GHz
|
12MB
|
1333MHz
|
$ 999
|
-
|
Q9550
|
2.83GHz
|
12MB
|
1333MHz
|
-
|
$ 530
|
Q9450
|
2.66GHz
|
12MB
|
1333MHz
|
-
|
$ 316
|
Q9300
|
2.50GHz
|
6MB
|
1333MHz
|
-
|
$ 266
|
Dual Core
|
E8500
|
3.16GHz
|
6MB
|
1333MHz
|
-
|
$ 266
|
E8400
|
3.00GHz
|
6MB
|
1333MHz
|
|
$ 183
|
E8300
|
2.83GHz
|
6MB
|
1333MHz
|
-
|
-
|
E8200
|
2.66GHz
|
6MB
|
1333MHz
|
|
$ 163
|
Source : MB Manufacturers , Complied by HKEPC Hardware ,Sept2007
|
65纳米短期内仍是主力 预估明年Q3出现交替
65纳米仍是短期主力
台主机板业者透露,根据Intel最新桌面处理器规划,由于2007年第四季仅发布1款45纳米处理器,而且为售价高昂的Core 2 Extreme系列,因此45纳米产品发布后首季,占Intel整体处理器出货量将不足2%。
其后在2008年第一季,由于45纳米效能级至高阶型号大军到位,因此45纳米产品占Intel整体桌面处理器出货将接近2成。2008年第二季,Intel将会推出入门级45纳米双核心,开始接替Core 2 Duo E4000 家族,预期出货比例将会提升至3成。
据Intel向主机板业者表示,45纳米处理器将会在2008年第三季迅速取代Intel Core 2 Duo E4000家族,预期45纳米产品在第三季所占桌面处理器比例将达5成以上,出现制程世代交替。
第2页:45纳米Penryn桌面四核心:Yorkfield 2.33GHz工程样本
45纳米Penryn桌面四核心:Yorkfield 2.33GHz工程样本
Intel Yorkfield 2.33GHz ES Sample
图为Intel下一代45纳米Penryn家族桌面四核心处理器工程样本,处理器序号为80569PJ053NL,采用Socket 775处理器接口。80569代表核心为Yorkfield、 P为桌面级主流级至效能级产品、J是1333MHz FSB、053代表频率为2.33GHz、NL则代表L2 Cache 容量为12MB,Core 2 Extreme版本的TDP为130W、Core 2 Quad版本的TDP则为95W 。
其支持MMX、SSE、SSE2、SSE3及SSE4.1指令集、Intel Virtualization Technology、Enhanced Intel SpeedStep、Intel 64Bit支持、Execute Bit技术及Intel Trust Execution Technology( TXT )。
Yorkfield核心其实并非单一芯片,它是把两颗双核心封装在一起,好处是Intel无需为四核心产品重新设计芯片,由于四核心现时市场占有率仍在5%以下,因此这个方法是最节省成本,并能提早问市时间。
不过,两颗双核心封装在一起,两者并没有直接的沟通桥梁,因此当要互相传取数据时,必需要经过 FSB ,延迟值将会略为提高。但据Intel表示,这个核心互相传取动作,比L2 Missed然后需要传取系统内存要快上 10 倍,而且 Intel Core微架构拥有加入了Memory Disambiguation设计,透过Out of Order过程分析内存读取次序,可令其读取提早执行 ,降低处理器的等候时间,减少闲置及延迟值。
Yrokfield内建8.2亿个晶体管,相比上代Kentsfield核心多出2.38亿个,主要原因为L2 Cache容量提升50% ,约占1.92 亿个晶体管,余下部份则为SSE4指令运算单元及微架构的改良部份。
虽然内建晶体管数目上升约40% ,但由于改采45nm制程,芯片大小由上代的286平方毫米,减至只有214平方毫米,有助成本进一步下降。
此外,Intel上代65纳米产品最高频率约为3GHz,频率超过3GHz后,功耗将会出现明显增长,而45纳米产品最高可达约4GHz,在 刚刚结束的IDF 2007 Fall大会上,Intel更展示5GHz超频示范,意味着Intel新一代45纳米将有一定的频率提升空间。
由于新一代45纳米产品在CPU GTLREF Ratio设定上有所变更,因此旧有主机板可能需要更新BIOS才能正常启动。
值得注意的是,尽管Intel一直强调只有3系列芯片组才能支持45纳米,但有主机板业者指出,其实965芯片组也能透过BIOS更新作出支持,不过VTT电压将会被设定至1.2V,处理器功耗会随之提高,减低产品寿命,965芯片组方案虽然可行,但并不建议采用。
(左) Intel 45nm Yorkfield 四核心 (右) Intel 65nm Kentsfield 四核心
非单纯制程进化 微架构亦作出改进
SSE4指令带来性能大幅提升
Yorkfield 支持新一代SSE4指令集( Streaming SIMD Extension 4 ),被视为继2001年以来最重要的媒体指令集架构的改进,除扩展Intel 64指令集架构外,还加入有关图形、视频编码及处理、三维成像及游戏应用等指令,令涉及音频、图像和数据压缩算法的应用程序大幅受益。
据了解,SSE4将分为4.1 版本及4.2 版本,4.1版本将会首次出现于Penryn处理器中,共新增47条指令,主要针对向量绘图运算、3D游戏加速、视像编码加速及协同处理加速动作,包括︰
Penryn SSE4 Instruction summary
|
Instruction Category |
Instructions
|
Benefits
|
Packed DWORD Multiplies
|
PMULLD , PMULDQ
|
提升编译器矢量运算效能
|
Floating Point Dot Product
|
DPPS , DPPD
|
3D立体制作及游戏,支持CG及HLSL等语言
|
Multi-packed sum of absolute diffs& min pos
|
MPSADBW , PHMINPOSUW
|
视讯编码处理
|
Streaming Load
|
MOVNTDQA
|
视讯编码处理、绘图及GPU数据分享
|
Floating Point Round
|
ROUNDPS , ROUNDSS , ROUNDPD , ROUNDSD
|
视讯编码处理 、绘图、影音处理、2D/3D应用、多媒体及游戏等
|
Packed Blending
|
BLENDPS , BLENDPD , BLENDVPS , BLENDVPD , PBLENDVB , PBLENDDW
|
编译器矢量运算及影音处理、多媒体、游戏等应用
|
Packed Integer Min and Max
|
PMINSB , PMAXSB , PMINUW , PMAXUW , PMINUD , PMAXUD , PMINDS , PMAXSD
|
Register Insertion/Extraction
|
INSERTPS , PINSRB , PINSRD , PINSRQ , EXTRACTPS , PEXTRB , PEXTRD , PEXTRW , PEXTRQ
|
Packed Format Conversion
|
PMOVSXBW , PMOVZXBW , PMOVSXBD , PMOVZXBD , PMOVSXBQ , PMOVZXBQ , PMOVSXWD , PMOVZXWD , PMOVSXWQ , PMOVZXWQ , PMOVSXDQ , PMOVZXDQ
|
Packed Test & Set
|
PTEST
|
Packed Compare for Equal
|
PCMPEQQ
|
Pack DWORD to Unsigned WORD
|
PACKUSDW
|
除了采用更先进的 45 纳米制程及加入全新 SSE4 指令集外,Penryn亦基于Intel Core微架构设计作出多项改良,称为Enhanced Intel Core Microarchitecture,并加入了︰
Fast Radix-16 Divider ( 快速 Radix-16 除法器 )
Super Shuffle Engine ( 超级洗牌引擎 )
Split Load Cache Enhancement ( 增强型缓存拆分负载 )
Improved Store Forwarding ( 存储转发 )
Faster OS Primitive Support ( 高速操作系统同步原始支持 )
Virtualization Performance Improvements ( 增强的 Intel 虚拟化技术 )
Deep Power Down Technology ( 深度节能技术 )
Enhanced Dynamic Acceleration Technology ( 增强型动态加速技术 )
据Intel资深工程师兼Penryn微架构主管Stephen Fischer表示,与上代处理器产品相比,Penryn处理器在绘图效能约超过15%、视讯编码平均可提高20%、3D内容制作可提高逾30%,3D游戏效能更可高达40%,视乎软件设计而定。
45纳米处理器加入0.5x倍频设定
45纳米处理器加入0.5x倍频设定
值得注意的是,Intel将会在45纳米Core 2处理器中加入0.5x 倍频设定,根据Intel Yorkfield EMTS Rev 1.1文件中指出,45纳米处理器最低倍频为6x,但由7.5x倍频数开始拥有0.5x倍频设计直至13.5x,最高倍频数为15x。
追加0.5x倍频数的主要原因为新一代处理器的外频由266MHz提升至333MHz,如果沿用整数倍频,则每一级产品的频率差距亦会同样上升,型号数目变少难以覆盖整个产品线,加入0.5x倍频后,产品线型号的设定弹性将大幅提升,同样的做法AMD亦早用于AM2处理器中。
第3页:效能测试:45纳米比拼65纳米四核处理器
效能测试︰ 45nm V.S 65nm @ Quad Core:
Intel Yorkfield 2.33GHz CPU-Z检测
|
Yorkfield 7X333 2.33GHz
|
QX6850 7X333 2.33GHz
|
Performance Boost Up %
|
PC Mark
|
|
|
|
Overall
|
8223
|
8007
|
2.70%
|
CPU
|
7504
|
7319
|
2.53%
|
Memory
|
5592
|
5394
|
3.67%
|
Graphics
|
14170
|
13874
|
2.13%
|
|
|
|
|
SiSoftware Sandra 2007
|
|
|
|
ALU
|
43225
|
42276
|
2.24%
|
ISSE3
|
34168
|
29682
|
15.11%
|
Int
|
258883
|
258426
|
0.18%
|
Float
|
139815
|
139225
|
0.42%
|
Ram bandwidth int
|
6911
|
6464
|
6.92%
|
Ram bandwidth float
|
6861
|
6446
|
6.44%
|
Cinebench
|
|
|
|
Single CPU
|
429
|
386
|
11.14%
|
Mutil CPU
|
1371
|
1234
|
11.10%
|
C4D
|
5110
|
4550
|
12.31%
|
OpenGL Hardware
|
2691
|
2588
|
3.98%
|
|
|
|
|
Science Mark 2
|
|
|
|
Total
|
1466.22
|
1378.61
|
6.35%
|
Meleciular
|
1276.46
|
1115.78
|
14.40%
|
Primordia
|
1344.35
|
1238.76
|
8.52%
|
Cryptography
|
1067.48
|
1041.91
|
2.45%
|
Stream
|
1794.68
|
1743.38
|
2.94%
|
Memory
|
1769.67
|
1710.37
|
3.47%
|
Flop
|
1850.62
|
1789.89
|
3.39%
|
|
|
|
|
Divx 6.6 Alpha w/SSE4
|
|
|
|
1080p Mpeg2 to Mpeg4
|
27s
|
49s
|
81.48%
|
|
|
|
|
Manconcept H.264 Encoder
|
|
|
|
1080p Mpeg2 to H.264
|
118.58s
|
121.24s
|
2.24%
|
|
|
|
|
Window Movie Maker
|
|
|
|
Publishing movie
|
141.6s
|
141.7s
|
0.11%
|
|
|
|
|
Window Photo Gallery
|
|
|
|
Print to xps
|
44.33s
|
44.5s
|
0.52%
|
Send to mail
|
33.88s
|
34.605s
|
2.14
|
|
|
|
|
Adobe photo elements 5.0.2
|
|
|
|
SmartFix
|
169.753s
|
173.6s
|
2.88%
|
Album creation
|
35.8488s
|
36.239s
|
5.80%
|
|
|
|
|
Micosoft office 2007
|
|
|
|
Word
|
47.89s
|
49.27s
|
2.88%
|
PowerPoint
|
69s
|
73s
|
5.80%
|
Big number
|
6.927s
|
6.973s
|
0.66%
|
Option pricing
|
23.946s
|
25.537s
|
6.64%
|
|
|
|
|
3D Mark 05
|
|
|
|
1024 x 768
|
15203
|
14971
|
1.55%
|
CPU Test
|
17495
|
16907
|
3.48%
|
Test 1
|
10.7
|
10.2
|
4.90%
|
Test 2
|
12.8
|
12.5
|
2.40%
|
|
|
|
|
3DMark 06
|
|
|
|
1280 x 1024
|
11630
|
11534
|
0.83%
|
SM2
|
4798
|
4789
|
0.19%
|
SM3/HDR
|
5087
|
5054
|
0.65%
|
CPU Test
|
3490
|
3406
|
2.47%
|
Test 1
|
1.15
|
1.121
|
2.59%
|
Teat 2
|
1.694
|
1.656
|
2.29%
|
|
|
|
|
Doom3
|
|
|
|
1024 x 768
|
216.1
|
200.8
|
7.62%
|
|
|
|
|
FarCry
|
|
|
|
1024 x 768
|
131.95
|
123.53
|
6.82%
|
|
|
|
|
FEAR
|
|
|
|
1024 x 768
|
286
|
267
|
7.12%
|
|
|
|
|
Half-Life 2
|
|
|
|
1024 x 768
|
185
|
131
|
41.22%
|
|
|
|
|
Serious sam2
|
|
|
|
1600 x 1200 4AA 16AF
|
194.2
|
152.6
|
27.26%
|
|
|
|
|
|
Yorkfield 7X333 2.33GHz
|
QX6850 7X333 2.33GHz
|
Idle ( ESIT Disable )
|
|
|
Power
|
57W
|
72W
|
Core Temp
|
35C
|
43C
|
|
|
|
Max Power loading Tools for Vista
|
|
|
Power
|
79W
|
95W
|
Core Temp
|
46C
|
57C
|
此次编辑部找来Intel Yorkfield 2.33GHz工程样本,与Intel Core 2 Extreme QX6850降频至( 7 x 333 )作对比测试,由于两者核心频率相同,测试后即即可得知全新Penryn家族在微架构改良后的增幅变化。根据结果显示,在部份视讯编码处理、绘图、影音处理、2D/3D 应用、多媒体及游戏等应用上有5-8%的增益,相较双核心Wolfdale的增益虽略有不及,但效果仍令人满意。
其中,Penryn处理器家族改用Radix-16 Divider(除法器),同时可处理每笔4Bit的数据,相较以往Radix-2或Radix-4 divider只可处理每笔2Bit的数据,在整数及浮点数运算能力明显提升,因此在Science Mark 2中已能反映。
此外,由于游戏会大量使用平方根运算,拥有Radix-16 Divider 的Yorkdale,在3D游戏测试项目中,相比上代至少有 7% 的增长,而大量采用平方根运算的Half-Life 2 更为明显,效能提升达41.22%。
SSE指令执行表现,可从Sandra 2007指出Yorkfield的SSE3执行效率部份上升了约15% ,反映出全新 Super Shuffle Engine设计有着明显改善,如果软件支持SSE指令集,这颗处理器的效能增益将会更为显着。
由于大部份测试软件均未支持全新SSE4指令集,因此令Yorkfleld的真正实力被埋没,此次测试中仅DivX 6.6 Alaph支持SSE4,测试显示其增益可达81.48%令人惊讶,预期未来会有更多软件加入SSE4指令集,测试成绩更会更理想。
值得注意的,此次效能测试并未包括45纳米制程是否能为处理器带来的频率提升空间,因此Penryn的真正实力未能由以上测试结果解悉,仅能获知改良后微架构所带来的增益,敬请注意。
功耗表现方面,采用全新45纳米High-K 制程的Yorkfield ,除晶体管数目提升达40%,但功耗下降约22% ,表现更加出色,且温度亦大幅降低,证明Intel 45纳米制程导入应用已十分成熟。
后记:
Nehalem处理器展示
由于AMD K10桌面处理器推出后首季最高频率仅为2.5 - 2.6GHz ,并没有对现有65纳米Intel Core 2产品线构成明显压力,因此Intel并没有赶着把45纳米处理器一窝蜂的推出市面 ,只象征性推出一颗Core 2 Extreme QX9650,以达至每年推出具增强微架构或全新微架构处理器产品的承诺。
有Intel官员表示,现时的产品布局是最保守的方案,如果AMD K10突然加强攻力,拥有充足的弹性以应付突发的市场改变,包括了核心频率及售价,而且在 刚刚结束的IDF 2007 Fall论坛上, Intel宣布下一代微架构Nehalem处理器已步入完成阶段,并可准时在2008年下半年上市。
据了解,Nehalem微架构将进一步扩大Intel在性能及功耗方面的领先地位,并具是英特尔第一款使用QuickPath互联系统架构的处理器产品。QuickPath将包括集成的内存控制器技术以及改善的系统组件间通信链路,而且在多处理器作业下,每颗处理器可以互相传送数据,并不需经过芯片组,从而大幅提升整体系统性能。
据Paul Otellini表示,Nehalem 微架构最高支持4颗处理器的Quick Path多路服务器环境,单一芯片最高可拥有2、4及8颗核心,支持经改良的Hyper-Theading 技术,令单颗处理器最高可支持16Threads,而且Nehalem架构亦准备推出内建绘图核心,不让AMD Fusion处理器专美。
因此 Yorkfield 家族只需支撑半年至9个月,就会被降格至中低端,与新一代Nehalem处理器连手夹 击AMD K10处理器。