不支持Flash

首测英特尔45纳米Yorkfield四核处理器

http://www.sina.com.cn 2007年09月26日 09:10  中关村在线
作者:范会文
第1页:Intel计划11月11日发布45纳米Yorkfieled
  新一轮x86处理器大战即将上演,面对着AMD K10全新微架构产品, Intel将以45纳米制程配合经强化改良的Core微架构应战,为了不让对手重夺技术主导权,Intel防堵大计预将陆续登场! 目前HKEPC分析了Intel未来半年的桌面处理器产品布局,并独家找来全港首颗45纳米四核心Yorkfieled,与上代Kensfield作对比测试。


首测英特尔45纳米Yorkfield四核处理器
45纳米四核心Yorkfieled

Intel计划于11月11日发布首款45纳米产品

首测英特尔45纳米Yorkfield四核处理器  首测英特尔45纳米Yorkfield四核处理器
英特尔45纳米工艺推进计划及制造工厂

  据台主机板业者表示,全球处理器龙头Intel将在会在2007年10月第三周正式生产新一代45纳米处理器,并预计在11月11日正式发布首款45纳米产品,首颗45纳米桌面处理器将会是四核心Yorkfield及Xeon DP四核心Harpertown。

  据了解,Intel 45纳米处理器样本是由奥勒岗州的Fab D1D试产,但该Fab只是作为45纳米处理器初期研发及试产工作,并无法进行量产,因此Intel 45纳米产品初期将全交由位于亚利桑那州、全新兴建的Fab 32负责生产。

  此外,以色列(Israel)的Fab28则预定于2008年上半年投入45纳米生产行列,而奥勒岗州的D1D晶圆厂则进行改建,以符合45纳米量产需求。

  根据 Intel 最新桌面处理器规划,首颗45纳米产品将是四核心Yorkfield,预定2007年11月11日面市,紧接着登场的则是双核心Wolfdale,预计2008年1月登场。

45纳米Yorkfield、Wolfdale型号将改变

首测英特尔45纳米Yorkfield四核处理器  首测英特尔45纳米Yorkfield四核处理器
英特尔新更名法则

  Intel早前宣布将会简化产品线命名法则,在2008年1月1日起,把现有Core 2 Duo及Core 2 Quad产品线合并为Core 2,在品牌中不再显示核心数目,只以产品型号中的开首英文作识别,但在各大OEM厂商的反对意见下,Intel最终取消以上决定,因此Core 2 Duo及Core 2 Quad产品线命名法则将会被保留。

  此外,为与上代65纳米产品作出有效识别,Intel亦计划采用全新的型号命名法则,四核心Yorkfield型号将编制为QX/Q9000 家族、双核心Wolfdale则命名为E8000家族。

  值得注意的是,旧有型号命名法则下,无论是四核心Kentfield及双核心Conroe,其型态第二位数字代表的频率数值是一样的,例如Core 2 Quad Q6600与Core 2 Duo E6600 同样 为2.4GHz 。

  但由于Intel 45纳米家族将四核、双核分为不同家族,因此第二位的频率数值将不再相同,例如 2.66GHz的Yorkfield 四核心处理器的型号为Core 2 Duo Q9450 ,但2.66Ghz的 Wolfdale 双核心处理器型号则为Core 2 Duo E8200 。

2007年内仅一款45纳米处理器上市

首测英特尔45纳米Yorkfield四核处理器
年内只有QX9650处理器会上市

  值得注意的是尽管Intel在2007年11月11日正式发布45纳米处理器,但其象征意义却远大于实际。

  据了解,Intel在2007年内仅有1款45纳米处理器上市,型号为Core 2 Extreme QX9650,核心频率仍保持3GHz,支持1333MHz FSB,内建12MB( 6MB x 2 ) L2 Cache ,支持Intel Virtualization Technology 、Intel Enhanced SpeedStep Technology 、Intel 64 Technology 及 Execute Disable Bit ,每千颗单价暂定 $ 999。

  Intel 45纳米大军直至2008 年1月份才会陆续登陆作战,暂定将会发布3颗四核心及3颗双核心产品。

  3款Yorkfield处理器将会包括Core 2 Quad Q9300、 Q9450及Q9550,核心频率分别为2.5GHz、2.6GHz及2.83GHz,支持1333MHzFSB,除了Q9300仅内建6MB( 3MB x 2 )L2 Cache,其余型号均为12MB( 6MB x 2 )L2 Cache,支持Intel Virtualization Technology、Intel Trust Execute Technology、Intel Enhanced SpeedStep Technology、Intel 64 Technology及Execute Disable Bit,每千颗单价分别为$ 266、$ 316及$ 530。

  双核心方面,3款Wolfdale处理器包括Core 2 Duo E8200、 Core 2 Duo E8400及Core 2 Duo E8500将会同时上阵,核心频率分别为2.66GHz、3GHz及3.16GHz,支持 1333MHz FSB,内建6MB L2 Cache,支持Intel Virtualization Technology 、Intel Trust Execute Technology、 Intel Enhanced SpeedStep Technology、Intel 64 Technology及Execute Disable Bit,每千颗单价分别为$ 163、$ 183 及$ 266。

Intel 45nm DT CPU Pricing ( 1Ku ) Q1, 2008

Model

Speed

L2 Cache

FSB

11-Nov

Jan 2008

Quad Core

QX9650

3GHz

12MB

1333MHz

$ 999

-

Q9550

2.83GHz

12MB

1333MHz

-

$ 530

Q9450

2.66GHz

12MB

1333MHz

-

$ 316

Q9300

2.50GHz

6MB

1333MHz

-

$ 266

Dual Core

E8500

3.16GHz

6MB

1333MHz

-

$ 266

E8400

3.00GHz

6MB

1333MHz

 

$ 183

E8300

2.83GHz

6MB

1333MHz

-

-

E8200

2.66GHz

6MB

1333MHz

 

$ 163

Source : MB Manufacturers , Complied by HKEPC Hardware ,Sept2007

65纳米短期内仍是主力 预估明年Q3出现交替

首测英特尔45纳米Yorkfield四核处理器  首测英特尔45纳米Yorkfield四核处理器
65纳米仍是短期主力

  台主机板业者透露,根据Intel最新桌面处理器规划,由于2007年第四季仅发布1款45纳米处理器,而且为售价高昂的Core 2 Extreme系列,因此45纳米产品发布后首季,占Intel整体处理器出货量将不足2%。

  其后在2008年第一季,由于45纳米效能级至高阶型号大军到位,因此45纳米产品占Intel整体桌面处理器出货将接近2成。2008年第二季,Intel将会推出入门级45纳米双核心,开始接替Core 2 Duo E4000 家族,预期出货比例将会提升至3成。

  据Intel向主机板业者表示,45纳米处理器将会在2008年第三季迅速取代Intel Core 2 Duo E4000家族,预期45纳米产品在第三季所占桌面处理器比例将达5成以上,出现制程世代交替。


第2页:45纳米Penryn桌面四核心:Yorkfield 2.33GHz工程样本

45纳米Penryn桌面四核心:Yorkfield 2.33GHz工程样本


首测英特尔45纳米Yorkfield四核处理器
Intel Yorkfield 2.33GHz ES Sample

  图为Intel下一代45纳米Penryn家族桌面四核心处理器工程样本,处理器序号为80569PJ053NL,采用Socket 775处理器接口。80569代表核心为Yorkfield、 P为桌面级主流级至效能级产品、J是1333MHz FSB、053代表频率为2.33GHz、NL则代表L2 Cache 容量为12MB,Core 2 Extreme版本的TDP为130W、Core 2 Quad版本的TDP则为95W 。

  其支持MMX、SSE、SSE2、SSE3及SSE4.1指令集、Intel Virtualization Technology、Enhanced Intel SpeedStep、Intel 64Bit支持、Execute Bit技术及Intel Trust Execution Technology( TXT )。

   Yorkfield核心其实并非单一芯片,它是把两颗双核心封装在一起,好处是Intel无需为四核心产品重新设计芯片,由于四核心现时市场占有率仍在5%以下,因此这个方法是最节省成本,并能提早问市时间。

  不过,两颗双核心封装在一起,两者并没有直接的沟通桥梁,因此当要互相传取数据时,必需要经过 FSB ,延迟值将会略为提高。但据Intel表示,这个核心互相传取动作,比L2 Missed然后需要传取系统内存要快上 10 倍,而且 Intel Core微架构拥有加入了Memory Disambiguation设计,透过Out of Order过程分析内存读取次序,可令其读取提早执行 ,降低处理器的等候时间,减少闲置及延迟值。

  Yrokfield内建8.2亿个晶体管,相比上代Kentsfield核心多出2.38亿个,主要原因为L2 Cache容量提升50% ,约占1.92 亿个晶体管,余下部份则为SSE4指令运算单元及微架构的改良部份。

  虽然内建晶体管数目上升约40% ,但由于改采45nm制程,芯片大小由上代的286平方毫米,减至只有214平方毫米,有助成本进一步下降。

  此外,Intel上代65纳米产品最高频率约为3GHz,频率超过3GHz后,功耗将会出现明显增长,而45纳米产品最高可达约4GHz,在 刚刚结束的IDF 2007 Fall大会上,Intel更展示5GHz超频示范,意味着Intel新一代45纳米将有一定的频率提升空间。

  由于新一代45纳米产品在CPU GTLREF Ratio设定上有所变更,因此旧有主机板可能需要更新BIOS才能正常启动。

  值得注意的是,尽管Intel一直强调只有3系列芯片组才能支持45纳米,但有主机板业者指出,其实965芯片组也能透过BIOS更新作出支持,不过VTT电压将会被设定至1.2V,处理器功耗会随之提高,减低产品寿命,965芯片组方案虽然可行,但并不建议采用。

首测英特尔45纳米Yorkfield四核处理器
(左) Intel 45nm Yorkfield 四核心 (右) Intel 65nm Kentsfield 四核心

非单纯制程进化 微架构亦作出改进

首测英特尔45纳米Yorkfield四核处理器  首测英特尔45纳米Yorkfield四核处理器
SSE4指令带来性能大幅提升

  Yorkfield 支持新一代SSE4指令集( Streaming SIMD Extension 4 ),被视为继2001年以来最重要的媒体指令集架构的改进,除扩展Intel 64指令集架构外,还加入有关图形、视频编码及处理、三维成像及游戏应用等指令,令涉及音频、图像和数据压缩算法的应用程序大幅受益。

  据了解,SSE4将分为4.1 版本及4.2 版本,4.1版本将会首次出现于Penryn处理器中,共新增47条指令,主要针对向量绘图运算、3D游戏加速、视像编码加速及协同处理加速动作,包括︰

Penryn SSE4 Instruction summary

Instruction Category

Instructions

Benefits

Packed DWORD Multiplies

PMULLD , PMULDQ

提升编译器矢量运算效能

Floating Point Dot Product

DPPS , DPPD

3D立体制作及游戏,支持CG及HLSL等语言

Multi-packed sum of absolute diffs& min pos

MPSADBW , PHMINPOSUW

视讯编码处理

Streaming Load

MOVNTDQA

视讯编码处理、绘图及GPU数据分享

Floating Point Round

ROUNDPS , ROUNDSS , ROUNDPD , ROUNDSD

视讯编码处理 、绘图、影音处理、2D/3D应用、多媒体及游戏等

Packed Blending

BLENDPS , BLENDPD , BLENDVPS , BLENDVPD , PBLENDVB , PBLENDDW

编译器矢量运算及影音处理、多媒体、游戏等应用

Packed Integer Min and Max

PMINSB , PMAXSB , PMINUW , PMAXUW , PMINUD , PMAXUD , PMINDS , PMAXSD

Register Insertion/Extraction

INSERTPS , PINSRB , PINSRD , PINSRQ , EXTRACTPS , PEXTRB , PEXTRD , PEXTRW , PEXTRQ

Packed Format Conversion

PMOVSXBW , PMOVZXBW , PMOVSXBD , PMOVZXBD , PMOVSXBQ , PMOVZXBQ , PMOVSXWD , PMOVZXWD , PMOVSXWQ , PMOVZXWQ , PMOVSXDQ , PMOVZXDQ

Packed Test & Set

PTEST

Packed Compare for Equal

PCMPEQQ

Pack DWORD to Unsigned WORD

PACKUSDW

  除了采用更先进的 45 纳米制程及加入全新 SSE4 指令集外,Penryn亦基于Intel Core微架构设计作出多项改良,称为Enhanced Intel Core Microarchitecture,并加入了︰

  Fast Radix-16 Divider ( 快速 Radix-16 除法器 )

  Super Shuffle Engine ( 超级洗牌引擎 )

  Split Load Cache Enhancement ( 增强型缓存拆分负载 )

  Improved Store Forwarding ( 存储转发 )

  Faster OS Primitive Support ( 高速操作系统同步原始支持 )

  Virtualization Performance Improvements ( 增强的 Intel 虚拟化技术 )

  Deep Power Down Technology ( 深度节能技术 )

  Enhanced Dynamic Acceleration Technology ( 增强型动态加速技术 )

  据Intel资深工程师兼Penryn微架构主管Stephen Fischer表示,与上代处理器产品相比,Penryn处理器在绘图效能约超过15%、视讯编码平均可提高20%、3D内容制作可提高逾30%,3D游戏效能更可高达40%,视乎软件设计而定。

45纳米处理器加入0.5x倍频设定

首测英特尔45纳米Yorkfield四核处理器
45纳米处理器加入0.5x倍频设定

  值得注意的是,Intel将会在45纳米Core 2处理器中加入0.5x 倍频设定,根据Intel Yorkfield EMTS Rev 1.1文件中指出,45纳米处理器最低倍频为6x,但由7.5x倍频数开始拥有0.5x倍频设计直至13.5x,最高倍频数为15x。

  追加0.5x倍频数的主要原因为新一代处理器的外频由266MHz提升至333MHz,如果沿用整数倍频,则每一级产品的频率差距亦会同样上升,型号数目变少难以覆盖整个产品线,加入0.5x倍频后,产品线型号的设定弹性将大幅提升,同样的做法AMD亦早用于AM2处理器中。


第3页:效能测试:45纳米比拼65纳米四核处理器

效能测试︰ 45nm V.S 65nm @ Quad Core:


首测英特尔45纳米Yorkfield四核处理器
Intel Yorkfield 2.33GHz CPU-Z检测


 

 

Yorkfield 7X333 2.33GHz

QX6850 7X333 2.33GHz

Performance
Boost Up %

PC Mark

 

 

 

Overall

8223

8007

2.70%

CPU

7504

7319

2.53%

Memory

5592

5394

3.67%

Graphics

14170

13874

2.13%

 

 

 

 

SiSoftware Sandra 2007

 

 

 

ALU

43225

42276

2.24%

ISSE3

34168

29682

15.11%

Int

258883

258426

0.18%

Float

139815

139225

0.42%

Ram bandwidth int

6911

6464

6.92%

Ram bandwidth float

6861

6446

6.44%

Cinebench

 

 

 

Single CPU

429

386

11.14%

Mutil CPU

1371

1234

11.10%

C4D

5110

4550

12.31%

OpenGL Hardware

2691

2588

3.98%

 

 

 

 

Science Mark 2

 

 

 

Total

1466.22

1378.61

6.35%

Meleciular

1276.46

1115.78

14.40%

Primordia

1344.35

1238.76

8.52%

Cryptography

1067.48

1041.91

2.45%

Stream

1794.68

1743.38

2.94%

Memory

1769.67

1710.37

3.47%

Flop

1850.62

1789.89

3.39%

 

 

 

 

Divx 6.6 Alpha w/SSE4

 

 

 

1080p Mpeg2 to Mpeg4

27s

49s

81.48%

 

 

 

 

Manconcept H.264 Encoder

 

 

 

1080p Mpeg2 to H.264

118.58s

121.24s

2.24%

 

 

 

 

Window Movie Maker

 

 

 

Publishing movie

141.6s

141.7s

0.11%

 

 

 

 

Window Photo Gallery

 

 

 

Print to xps

44.33s

44.5s

0.52%

Send to mail

33.88s

34.605s

2.14

 

 

 

 

Adobe photo elements 5.0.2

 

 

 

SmartFix

169.753s

173.6s

2.88%

Album creation

35.8488s

36.239s

5.80%

 

 

 

 

Micosoft office 2007

 

 

 

Word

47.89s

49.27s

2.88%

PowerPoint

69s

73s

5.80%

Big number

6.927s

6.973s

0.66%

Option pricing

23.946s

25.537s

6.64%

 

 

 

 

3D Mark 05            

 

 

 

1024 x 768

15203

14971

1.55%

CPU Test

17495

16907

3.48%

Test 1

10.7

10.2

4.90%

Test 2

12.8

12.5

2.40%

 

 

 

 

3DMark 06 

 

 

 

1280 x 1024

11630

11534

0.83%

SM2

4798

4789

0.19%

SM3/HDR

5087

5054

0.65%

CPU Test

3490

3406

2.47%

Test 1

1.15

1.121

2.59%

Teat 2

1.694

1.656

2.29%

 

 

 

 

Doom3

 

 

 

1024 x 768

216.1

200.8

7.62%

 

 

 

 

FarCry

 

 

 

1024 x 768

131.95

123.53

6.82%

 

 

 

 

FEAR

 

 

 

1024 x 768

286

267

7.12%

 

 

 

 

Half-Life 2

 

 

 

1024 x 768

185

131

41.22%

 

 

 

 

Serious sam2

 

 

 

1600 x 1200 4AA 16AF

194.2

152.6

27.26%

 

 

 

 


 

 

Yorkfield 7X333 2.33GHz

QX6850 7X333 2.33GHz

Idle ( ESIT Disable )

 

 

Power

57W

72W

Core Temp

35C

43C

 

 

 

Max Power loading Tools
for Vista

 

 

Power

79W

95W

Core Temp

46C

57C

  此次编辑部找来Intel Yorkfield 2.33GHz工程样本,与Intel Core 2 Extreme QX6850降频至( 7 x 333 )作对比测试,由于两者核心频率相同,测试后即即可得知全新Penryn家族在微架构改良后的增幅变化。根据结果显示,在部份视讯编码处理、绘图、影音处理、2D/3D 应用、多媒体及游戏等应用上有5-8%的增益,相较双核心Wolfdale的增益虽略有不及,但效果仍令人满意。

  其中,Penryn处理器家族改用Radix-16 Divider(除法器),同时可处理每笔4Bit的数据,相较以往Radix-2或Radix-4 divider只可处理每笔2Bit的数据,在整数及浮点数运算能力明显提升,因此在Science Mark 2中已能反映。

  此外,由于游戏会大量使用平方根运算,拥有Radix-16 Divider 的Yorkdale,在3D游戏测试项目中,相比上代至少有 7% 的增长,而大量采用平方根运算的Half-Life 2 更为明显,效能提升达41.22%。

  SSE指令执行表现,可从Sandra 2007指出Yorkfield的SSE3执行效率部份上升了约15% ,反映出全新 Super Shuffle Engine设计有着明显改善,如果软件支持SSE指令集,这颗处理器的效能增益将会更为显着。

  由于大部份测试软件均未支持全新SSE4指令集,因此令Yorkfleld的真正实力被埋没,此次测试中仅DivX 6.6 Alaph支持SSE4,测试显示其增益可达81.48%令人惊讶,预期未来会有更多软件加入SSE4指令集,测试成绩更会更理想。

  值得注意的,此次效能测试并未包括45纳米制程是否能为处理器带来的频率提升空间,因此Penryn的真正实力未能由以上测试结果解悉,仅能获知改良后微架构所带来的增益,敬请注意。


  功耗表现方面,采用全新45纳米High-K 制程的Yorkfield ,除晶体管数目提升达40%,但功耗下降约22% ,表现更加出色,且温度亦大幅降低,证明Intel 45纳米制程导入应用已十分成熟。

后记:

首测英特尔45纳米Yorkfield四核处理器  首测英特尔45纳米Yorkfield四核处理器
Nehalem处理器展示

  由于AMD K10桌面处理器推出后首季最高频率仅为2.5 - 2.6GHz ,并没有对现有65纳米Intel Core 2产品线构成明显压力,因此Intel并没有赶着把45纳米处理器一窝蜂的推出市面 ,只象征性推出一颗Core 2 Extreme QX9650,以达至每年推出具增强微架构或全新微架构处理器产品的承诺。

  有Intel官员表示,现时的产品布局是最保守的方案,如果AMD K10突然加强攻力,拥有充足的弹性以应付突发的市场改变,包括了核心频率及售价,而且在 刚刚结束的IDF 2007 Fall论坛上, Intel宣布下一代微架构Nehalem处理器已步入完成阶段,并可准时在2008年下半年上市。

  据了解,Nehalem微架构将进一步扩大Intel在性能及功耗方面的领先地位,并具是英特尔第一款使用QuickPath互联系统架构的处理器产品。QuickPath将包括集成的内存控制器技术以及改善的系统组件间通信链路,而且在多处理器作业下,每颗处理器可以互相传送数据,并不需经过芯片组,从而大幅提升整体系统性能。 

  据Paul Otellini表示,Nehalem 微架构最高支持4颗处理器的Quick Path多路服务器环境,单一芯片最高可拥有2、4及8颗核心,支持经改良的Hyper-Theading 技术,令单颗处理器最高可支持16Threads,而且Nehalem架构亦准备推出内建绘图核心,不让AMD Fusion处理器专美。

  因此 Yorkfield 家族只需支撑半年至9个月,就会被降格至中低端,与新一代Nehalem处理器连手夹 击AMD K10处理器。

爱问(iAsk.com)
不支持Flash
·《对话城市》走进城市 ·城市发现之旅有奖活动 ·企业邮箱换新颜 ·邮箱大奖等你拿
不支持Flash
不支持Flash