不支持Flash

英特尔CTO:万亿级时代有效利用多核成关键

http://www.sina.com.cn 2007年04月04日 14:49  新浪科技

  作者:英特尔公司高级院士、首席技术官贾斯汀 (Justin Rattner)

  最近,英特尔发布的万亿级计算新闻引起了全世界媒体的热烈关注,不仅是技术类媒体,就连大众媒体也广泛报道了这个消息。这有点出乎我的意料。我从多次接受媒体采访中可以清楚地体会出:公众迫切期待了解未来计算设备的发展形态,以及他们将在何时用上这一全新技术。

  可喜的是,英特尔等公司的研究人员多年来一直在思考这一类问题。他们在实验室里开发出研究用原型芯片,切实构建出十年后才会发生的用户体验。在此,我会举出一些相关实例,以说明万亿级计算的神奇魅力!

  识别、挖掘和合成

  我曾在另外一篇文章中解释了为什么万亿级计算的出现正合时宜,文章介绍了数据识别、挖掘和合成(RMS)三大处理能力。下面我以实时运动捕捉技术等实例,来阐明RMS这一新理念。

  利用当前的双路机架式服务器制作一张“皮克斯”图像需要计算大约6个小时,而这只是一个正常片长的动画影片所需的14万4千帧图像中的一帧。假如可以在台式机中实时制作同等品质的图像,这将是多么激动人心!想像一下,当

赛车电脑游戏的画面可以跟影院放映的影像相媲美时,那是一种多么美妙的感受!为了实现这一用户体验,我们必须将每帧图像的计算时间由6个小时缩减至1/124秒,这要求计算机在性能方面大幅度提高,同时也要求万亿级浮点运算能力与显著改进图像制作的算法相结合。这就是RMS中的S所指的“合成”。

  合成并不仅限于图片制作,它也包括制作声音、动作以及实体间的精确互动。在未来以台式机为平台的动画制作中,当动画人物开口说话时,他们的面部肌肉将如真人般地精确运动。也许到时候我们将面临全新的课题:将来我们是否还需要真人演员?

  另一个例子是数据挖掘。在最新的实验中,我们可对用多摄像头同步监控的人体移动图像进行三维空间的数据挖掘。这一针对视频流的数据挖掘过程,旨在记录精确的全身运动。虽然我们目前对此还无法进行实时操作,但可以说已经相当接近这一水平了——我们不需要在人物衣服或蓝色背景屏幕上做标志(或发光点)即可完成任务。这就是RMS中的M所指的“挖掘”。

  一旦我们获得了身体运动信息,就可将其用于模拟人体骨骼模型。有了这种骨骼模型,动画动作将有可能基于运动学规律与真人运动高度逼真。到那时,我们还可以“在骨骼上加一层皮肤”,以创造出一个与真人一模一样的全合成人体动作,然后再对这个小小的虚拟世界加上灯光、阴影和倒影等效果,从而创造出一个逼真而且精确运动的合成图像。

  通过以上技术,替换掉你正在使用的Wii手持控制器也并非妄想。我们将看到:未来的视频娱乐可以通过“全身动作捕捉技术”,把用户的虚拟影像也嵌入到游戏、舞蹈指导或太极课程这样的视频中。

  摒除噪点,摒除抖动

  大多数人都有VHS(或品质更差)的家用视频。当我们在最新的50英寸高清显示屏上播放这些视频时,效果简直无法接受。如果使用手机上附加的摄像头,视频效果更加糟糕。

  幸运的是,一种新技术的问世将可以解决这些问题。这种称为“超分辨率”的新技术,可有效利用视频流中的大量冗余。从而,我们可以通过数字技术显著减少相机抖动的影响,提高分辨率,并通过挖掘每帧图像的其它信息修复各种影像问题。试想当你所有的手机视频都提升至标准的清晰度,DVD画面品质差的问题也彻底解决,从而变成高清DVD,那将是多么令人激动。这就必然会用到万亿级计算。间谍卫星已采用这一技术多年了,现在正是使之普及到千家万户的最好时机。

  如何有效利用万亿级计算的强大功能?

  Silent E曾一针见血地指出:开发万亿级计算的功能,内存和带宽必须相互匹配,否则内核将面临闲置,使用户难以真正受益。通过单个芯片提供大量处理能力相对比较容易,而通过解决内存和I/O带宽问题使80内核处理器高效工作则要困难得多。庆幸的是,我们已经有了满足未来需求的多种解决方式,在此略举一二:

  首先,我们需要将更多内存更靠近处理器,针对不同带宽和内存容量共有三种解决方式。第一种方式采用系统封装(SIP)技术,将内存芯片统一封装作为处理器,微软公司在Xbox 360中使用了这一技术;第二种方式将内存芯片堆栈在处理器下方,我们计划在下一步的实验中将此技术用于万亿级计算研究用芯片;第三种方式将DRAM内嵌在处理器上,即IBM在2007年国际固态电路年会(ISSCC)上所提及的方式。哪种方式是最佳解决方案,尚需更多研究,但解决方案肯定不止一种。

  芯片上内核之间高带宽的数据传输也是一个挑战。在我们持续提高电子信号速度的同时,光信号也日益成为令人瞩目的焦点。使用光信号的成本正在不断下降,而到我们实现硅光子解决方案时,这个成本还可以进一步降低。那时,如果我们能使硅光子解决方案的成本接近电子信号的成本,并同时提高光信号的灵活性和互动性,我们将毫无疑问地首选硅光子解决方案。一旦这一转型成功实现,每个光纤每秒传输10万亿级数据将指日可待。

  万亿级计算性能魅力无穷,让我们共同拭目以待。

    本文译自英特尔公司高级院士、首席技术官贾斯汀博客文章《Tera-Scale: What Would We Do with All These Cores and How Would We Feed Them?

    更多文章请访问贾斯汀博客

发表评论
爱问(iAsk.com)
不支持Flash