不支持Flash

中国计算机报:万亿级计算有望走向桌面

http://www.sina.com.cn 2007年03月05日 14:46 中国计算机报

  刘洪宇

  万亿级计算是一场计算能力和创新数量上的双重革命,而这将是处理未来先进应用的必然选择。透过英特尔发布的最新成果,我们意识到万亿级计算时代已渐行渐近,其技术是如何实现的?又将怎样影响我们的未来生活?

  “万亿级”本身是指由具有万亿次浮点计算性能的平台来处理的万亿字节数据,其计算能力是当今千兆级设备的一千倍。如此庞大的处理能力曾是如IBM蓝色基因/L这样的超级计算机的专利,而现在,您可以设想,未来5~10年间,个人电脑甚至手持终端设备也将获得这样的能力。

  “万亿级”的多核路径

  在日前举行的国际固态集成电路会议年会上,英特尔公布了其“万亿级计算”研究项目的最新成果,英特尔研制的世界上首个具有万亿次浮点运算性能的可编程处理器成功问世,其运算性能与超级计算机类似,这预示着万亿级计算时代已经开启,相关产品有望在特定商业和科学领域应用后,最终扩展至消费设备市场。

  在2月26日英特尔(中国)研发中心举行的技术交流会上,研发中心负责人杜江凌博士向媒体披露了部分技术细节。据介绍,该处理器基于45nm制程,集成了80个内核,1亿个晶体管,每个内核都有两个可编程的浮点引擎,其电路设计的构造要比只处理指令的整数引擎复杂得多;尽管运算性能取得重大突破,其尺寸和耗电量却控制得非常出色,仅为275平方毫米的大小,与成人的拇指相当,在以3.16 GHz的频率执行每秒1万亿次浮点运算时,功耗仅为62瓦。我们可以对比1996年万亿次浮点运算首次实现的情形,名为ASCI Red的超级计算机采用了104个机柜,占地2000平方英尺,装有近1万颗 Pentium Pro处理器,耗电500千瓦。而10年之后,仅在一个多核心芯片上就实现了同样的性能,如果进一步提升主频和电压,浮点运算能力还能继续提升。

  从技术实现的角度来看,该芯片采用了一系列首次应用的创新技术,使用“

瓷砖片”设计是其显著特点,由计算单元和路由器组成的小内核像“瓷砖片”一样重复平铺开来,这样就很容易设计出多内核芯片;为了解决好内核与内核之间的通信问题,该芯片的另一大特点就是在芯片上具有网格状的“片上网络”,内核以网状格联网,内核间能通过5端口的传送路由器以超高带宽通信,在芯片内部以每秒万亿位的速度传输数据。研究项目还对分别打开或关闭各个内核的方法进行了研究,这样就可以根据需要启用那些为完成某项任务而工作的内核,从而极大提高了能效。

  在

能源管理上,该芯片的控制粒度更为精细,突出体现在每个内核中的单个计算引擎和数据路由器,能根据运行应用对性能的要求来激活或进入动态休眠状态,每个内核具有21个可休眠区域,有效提高了能效;新式的、模组时钟方案也比全局时钟更为节电。45nm制程则构成了高能效和多核架构的根基,与65nm制程相比,漏电功率得到了有效控制。

  “万亿级”将带来什么

  万亿级计算性能以及传输万亿字节数据的能力,将在今后的随时随地可以接入互联网的计算机中起到关键性作用,同时也将推动高分辨率娱乐内容的创新。在强大计算能力的保障下,处理器将可以执行面向设备的人工智能、实时语音识别、数据挖掘、针对建模、虚拟化、物理模拟的虚拟现实等大数据量任务。

  同时,数据存储量正在日趋增加。在医学领域,一次全身医疗扫描便包含了万亿字节的信息;即便在家中,我们也会处理大量数据,比如数百小时的视频,数千份文件,数万张数码照片等等,这些都需要编入索引和搜索,针对这些应用,万亿级计算是将超级计算机的大规模计算能力推广到日常设备上的理想途径。试想,您可以实时创建相当于工作室质量的照片级三维图像;您还可以通过对照片和家庭视频进行自动分析、标记和归类来管理个人媒体;低分辨率摄像机拍摄的影像也可利用高级算法获得改善……

  万亿级技术的普及必将带来应用上的深刻变革,曾被看作是异想天开的事将有可能成为现实。

发表评论
爱问(iAsk.com)
不支持Flash
 
不支持Flash
不支持Flash