不支持Flash
|
|
|
图文:谷歌中国首席战略官郭去疾演讲http://www.sina.com.cn 2008年03月29日 12:30 新浪科技
谷歌中国首席战略官郭去疾(全智 摄) 新浪科技讯 3月29日上午消息,CSDN今日在北京召开2008中国软件技术英雄会。此次英雄会邀请百名专家、技术主管和社区精英,共同探讨技术趋势、个人及企业成长、软件产业和创新等话题,主题演讲涵盖五大领域。 下为谷歌中国首席战略官郭去疾演讲全文。 郭去疾:代表Google给各位英雄致敬,我已经五年没有写过程序了,我的演讲肯定有一个好处,大家都听得懂,而且我会尽量让我的演讲短一点,我简单介绍一下我自己,我看印刷品上好象没有我的介绍,我现在在Google做中国首席战略官,我是2005年回中国建Google办公室的,之前在Google总部做产品经理,我对早是学技术出身的,中国科技大学毕业,然后到美国留学。 我今天的题目是“Google语音”计算,第一讲讲Google的使命,然后讲讲Google认为语音计算时代到来所面临的挑战。大家都知道Google的使命是整个环球的信息,让人人可以使用,让人人可以受益,大家也知道我们做了很多宣传,有很多Google funs帮我们宣传,说Google成功有三条:第一创新机制,第二创新的文化,第三是商业模式,第四条大家不太知道,就是我们有非常强大的计算能力,Google存储的不仅仅是今天的互联网,我们存储了互联网整个历史,第二我们有非常多的各种各样数据,比如Google earth 卫星数据。这么多数据就面临一个很重要的问题,就是如何处理数据,是不是有一个计算模式的挑战,我们认为是非常根本性的创新,Google从第一天开始就把自己当成计算公司,而不是搜索公司。我们做了一套世界上从来没有人做过的基于低成本PC的体系,最开始没有钱,所有机器都是东拼西凑来的,逼迫他们做三件事情:第一机器很便宜,第二机器都是异构;第三机器都很烂了,坏了很多,最后结果就是我们做了一个世界上最好的机器。为什么我们认为低端PC是最好的,PC机群性价比大概30倍左右,这是非常可观的数字,比如别人要投30亿美金,我们投1亿美金就可以了,因为我们需要的机器非常多,第二这么多机器,尤其机器这么差,所以容错很重要,假设现在买的PC比以前收来的PC好一点,一年坏一次,或者很少换,十万台机群每天55台报废,一秒也不能档机,容错是异常情况,对我们来说错误是正常情况,每天换55台机器,相当于每小时换2台机器,其实Google服务器数量远远不止这些。其实很多时候坏的不光是机器,网络也可能坏,可能失火,比如去年的一个例子,去年台湾的地震,地震之后中美两国之间光纤断了,几乎国外所有网站都不能访问,Google所有东西没有断过一秒钟,就是因为我们有容错的机器和带宽。这个是Google历史的数据中心,1997年在车库里,1998年收购各种各样计算机,1999年自己拼装机器,后面到了比较新的机群,这张图是现在Google的机房。讲一个笑话,曾经有一个机房按面积收费,结果他不知道Google机器在同样面积可以堆很多,做一年之后这个机房破产了。破产原因主要是因为我们的机器堆了很多,用了他很多电,他收的钱根本不够交电费的。很早以前Google机器跟Ebay机房放一起,Google机器发很多热,拿电风扇吹,最后把Ebay机器也坏了。 回顾一下计算模式的发展历史,最早时候大家知道是巨型计算机,后来变成小型机,那时候要做的应用很简单,就是大规模计算,再后面发展,突然具有颠覆性,PC来了,PC互不相连,这个时代典型应用就是Word、Excel单机应用,再往后走出现CS结构,有一个客户端和服务机端,你的数据处理能力很强,CS结构有很大问题,非常不灵活,最大问题就是怎么更新客户端的问题,这是非常痛苦的事情,后面出现了网页,有点像最早的模式。 我们认为今天互联网有非常强的客户端,网线比自己的总线还快,这时候的应用就需要语音计算。看计算发现历史,我们发现几乎是断裂的,有三个东西在赛跑:一个计算能力,还有一个存储能力,还有一个网络带宽,这三个基础结构的改变,带来了应用模式、计算模式、体系结构互相之间的适应。这张图实际上是一幅动画,在黑暗中看到很多星光,有没有人知道星光是什么?这是搜索的星光,我们叫做永不停息的搜索,任何一秒钟都在有人做巨大的搜索,讲的是很典型的语音计算的应用。大家说搜索很简单,很多人都可以做,什么叫终级搜索,我们的使命是看到明天,最终搜索是能够准确理解用户的查找意图,在这样的应用下,不仅仅是网页,不仅仅是文本,不仅仅是PC,让搜索变成并不是一个静态紧张的应用。 语音计算的到来,有两个根本原因:第一海量数据,而且是没有结构的数据,第二复杂的应用,有非常多的用户,比如Google Earth例子,第二你要在任何时间任何地点进行应用。语音这个时代带来的挑战是什么呢?第一就是需要一套新的硬件体系结构,能够支持这样的应用,大家知道服务器很贵,很少厂商可以做到这么多机器,我不能给大家透露Google有多少机器,假设Google是硬件服务器制造商的话,每年制造服务器数量可以排全世界所有服务器制造商的前四名,第二有这么多机器,需要非常好的分布式系统,把互联网当成因特网一样使用;第三要在上面开发新的编程语言,当你操作互联网所有数据,需要新的编译器、新的操作语言。Google实际上集合了各个方面的计算机科学专家。为什么现在是由Google引领语音计算潮流呢?第一是我们成为世界上第一个有这么多计算机的人;第二Google开发了很重要的东西,我们认为是未来语音计算的基础,第一Google文件系统,很多人可能不知道Google有这么大的存储,Google其实没有真正的数据库,所有数据存在非常简单有效的文件系统里,这个文件系统最大特点就是能够存很多数据,第二非常快,第三非常并发;第二我们发明一套新的开发语言或者模式,所以Google就引领了这样一个潮流,我们最近和IBM有些合作,让他们成为我们的后方。还有一些其他厂商试图做类似事情,他们各自有各自的挑战。 这是一个简单的例子,比如你要做一件简单的事情,你要统计世界上所有网页里有多少网页里出现了Google这样一个词,说起来一句话就可以描述,但是要写一个程序,用传统的方法要写很久,用我们这个方法就很简单,第一把所有数据拆成很多份,第二在每个服务器里统计那些有Google,第三加起来,这件事情要非常容易的并发,而且要非常容易的在1%秒或者更短时间内算出来,而且调动的这些机器很可能在世界上不同地方。 可以说现在Google所有的产品都是基于语音计算概念的,Google真的建成了世界上最大的并行计算平台,世界上可能知道有超级计算机的排名,Google不是一台计算机,可能排不进去。还有一个例子就是最近我们推出的Google e-mail,比如很多企业都想用很好的邮件系统,另一方面要想用自己的域名,我们给你一个很容易的方式,让所有员工都可以用6.5G帐户一样,但是都是你的域名,我们提供e-mail 服务,我们在中国虽然没有做大规模推广,已经有非常多的中小企业使用,这就是语音计算的典型例子。很多人说世界上有没有人敢把数据放在你们那里,多危险,数据不在家里,放你Google服务器里,是不是很可怕的事,我每次回答这个问题时候都很简单,我说一百年以前没有人相信银行,所有人都在自家院子里挖一个洞,把金子埋进去,今天所有人的钱都存银行,慢慢你会发现存在服务器端数据比存自己机器里安全。Google Earth也是非常典型的意思。 Google的机器翻译,Google用了三年时间成为了世界上最领先的机器翻译提供者,黄色的是Google,蓝色的是其他厂商和研究机关,这是全世界机器翻译比赛,Google遥遥领先,很多人说是不是因为Google很懂翻译,其实Google一点也不懂翻译,而且我可以告诉大家,Google做中英文翻译团队里一共就三个人,而且没有一个懂中文的,我到清华大学跟他们讲,他们不相信,但是真的是这样,我们为什么比别人做的好?其实很简单,我们就是有比别人多的数据,从75兆数据到200billion数据经常可以提高5个百分点,相当于别人5-10年研究成果,我们在三年时间里超过所有研究语法的翻译专家。 语音计算的时代其实对人才有很多需求,大家要学归分布式并行编程能力,如果你是在校学生,或者刚刚进入这个行业,我非常鼓励你学习这个东西,对你今后十年或者二十年职业生涯会有很大用处,我们已经在跟一些大学合作,做了很多工作,第一我们找到了一套开源和GSF代码,我们又做了1600个CPU数据中心捐给了大学,最近在美国华盛顿大学开放了编程大学,在中国清华大学也做了开放课程,已经有很多学生学习了编程,我非常鼓励没有学过的同学学习。今后还会在中国各个高校开设类似的课程,我们选择这套系统跟Google内部东西无关,编程思想和体系结构跟Google非常一致,我们认为也代表了这项技术的发展方向,我们认为非常值得大家学习。 今天我讲了这么多,我希望大家记住一句话:计算方式的变革,是一次颠覆性变革,每一次这样的变革都会有巨大机会,云已经飘来了,你准备好了吗!谢谢各位!
【发表评论 】
不支持Flash
|