科技时代新浪首页 > 科技时代 > 互联网 > 新浪科技评论空间专题 > 正文

姜奇平:搜索引擎下一个八年展望(下)


http://www.sina.com.cn 2005年08月22日 18:58 eNet硅谷动力

  作者: 姜奇平

  【eNet硅谷动力专稿】我们退一步说,如果搜索引擎失去通过平台化形成产业的机会,而只作为单一技术应用继续发展,它的下一步,仍然有许多机会。这种机会——也就是就技术应用谈技术应用的机会——并不依赖平台化和产业化,是搜索引擎自身发展的机会。 

  以用户为中心看搜索引擎

  在具体谈及这些机会前,我们还是从普通最终用户的角度,看看对搜索引擎的不满在何处。这些不满,实际就是未来引擎填补空白的机会。

  用户需求

  从最终用户的立场看,花费最小成本,准确找到所要信息,是根本的需求。对搜索引擎的其它需求,都是由此派生出的二手、三手的需求。

  所谓准确找到所要信息,又包含两个基本的方面,一个方面是不遗漏有用的信息,另一个方面是不出现没用的信息。如果进一步描述,这里的“有用”与“没用”,还可以加上程度限定。搜索结果按先后顺序应是最有用的、次有用的、一般有用的……;不希望出现的结果先后顺序是起误导作用的、最没用的、一般没用的……。

  所谓花费最小成本,包括时间成本和心智成本。在最小成本状况,最终用户以最短时间、最傻瓜化的付出,就可以获得想知道的事情。举例来说,皇帝一个眼神,大臣就知是什么意思,就能马上提供上中下最佳方案,供皇帝决策选择。这里的大臣就相当搜索引擎。今天搜索引擎的服务水平,只相当于一两个饭筒级的大臣在为比皇帝行政级别还高一级的上帝服务。这就是差距。

  需求的意义

  搜索引擎需求的根本意义,在于节省用户的决策成本。

  节省决策成本就是指:以最小的注意力代价,获得最大程度的有用信息。解决海量信息与有限注意力之间的矛盾,这个问题是信息经济的核心问题。它首先是由诺贝尔奖获得者西蒙提出来的,这个问题曾被无知媒体妖魔化为“注意力经济即炒作”这个伪命题。

  “天下熙熙皆为利来,天下攘攘皆为利往”。这个普遍真理,到了第三波人类的具体实践中,这个“利”的核心,就是解决最稀缺的信息选择资源(注意力)与最消耗这种资源的信息不确定性之间的矛盾。或者说,是有序化信息的能力,与信息无序化耗散之间的矛盾。搜索引擎就正坐在信息时代财富的十环靶心上。

  基本原理虽然简单,但GOOGLE、百度们,也就只能理解七八成(只歪歪地射在七八环上,就可以在纳斯达克冒充冠军,可见现在的小孩子们,一旦稍稍提高准星,未来还有多大赚钱机会)。不信,我们举证如下:现在GOOGLE、百度们采用的竞价排名,采用的就是通过提高用户的搜索成本的方式,来间接降低用户的搜索成本。这只是七八环的做法,而非十环的做法。

  直接满足用户需求是根本的需求,而通过满足客户需求间接满足最终用户需求,如竞价排名,则是派生的需求。如果说,派生的需求应由平台基础上的增值开发决定,那么根本的需求,就只能通过搜索引擎的自身完善来做到了。现在这两方面都不到位。而二者又有联系,之所以让派生的需求反客为主,正是因为根本需求满足在平台上的不到位。如果基础电信运营商或微软回过味来,大规模开发开放性的搜索引擎平台,任增值商在手机和电脑上嫁接搜索增值业务,GOOGLE、百度们的弱点就会暴露无遗。那时如果不开放的话,恐怕连拥有阿里巴巴那样的平台可遁的雅虎都不如。

  那么,象GOOGLE、百度们这样的王安式的孤军作战型商业模式,如何自保呢?我认为唯有一途,就是要在引擎本身技术的开发上,跑得比基础运营商和微软快,发挥专的特长。而主攻方向,恰恰在与竞价排名商业模式相反的技术方向上。眼下,解决商业模式与技术方向相反的矛盾,就是GOOGLE、百度们在平台战略外要考虑的主要问题。 

  搜索引擎如何节省决策成本

  决策成本是由必要搜索范围、信息量、有用程度、有用信息量这几个要素构成的。这种决策成本是由必要搜索范围内所需处理信息量比上有用信息量构成的。有用信息量越大,同等信息量越有用,决策成本就越低。加上必要搜索范围,限定了不是搜索范围越大或越小越好,

  从这里可以看出,搜索引擎技术的主要矛盾,就是解决搜索范围与信息有用性之间的矛盾。搜索范围越大,成本越高,有用性概率越高;搜索范围越小,成本越低,但有用性信息概率也越小。如何让搜索范围既不过大,又不过小呢?这就跟有用联系在一起了。否则,或者扩大,或者缩小。都不能使用户满意度最大化。

  如何确定什么信息是有用信息?我有一个基本的观点认为:“有用”,从根本上说,是针对用户语用的。语用是指用户表达意义的上下文环境。这是第三代搜索引擎的理念。所谓智能化、个性化,都要建立在这个基础之上。

  我们首先看看现在进行时的技术发展到了什么阶段和水平:

  第一代搜索引擎的“有用”,指向的是用户语形。语形也就是用户需求表达在语言上的表面上的意思。只要见到关键词就统统搜出来,不必要地扩大了搜索范围,出现过量无用信息的情况,提高了决策成本。第二代搜索引擎的“有用”,指向的是用户语义。通过本体论挖掘,在元数据结构层面上,解决对“模拟”的语言编码解码的问题;同时通过分词技术和语料库积累,解决关键词与文本的匹配问题。主题词技术和智能文档技术,因此成为这一代引擎的关键引导技术。我所看到的最好的技术(当然不是GOOGLE和百度),已经可以做到在搜索结果中,不包含关键词,即可以在一定程度上摆脱语形,具有初步的机器推理能力(这在理论上还是一个有严重争议的问题)。举例来说,花朵,可能只是一个比喻,说的是儿童,而与花卉养殖无关。如果一篇文章全是比喻,不提儿童二字或相关字眼,第一代引擎就无能为力了。但如果利用“用代属分族参”这六性进行元数据结构分析,就可能突破语形。这就是第二代技术。至于通过各种没有基础理论和技术支持的捷径突破语形障碍,那是等而下之的商业作法,不在讨论之列。

  但我认为技术发展到这里,并没有结束,不象有的专家认为的那样,搜索技术已经到头,剩下的就是应用了。我认为搜索技术还在初级阶段,远没有到头。我可以非常有把握地对12岁一族们说,你们的百度哥哥、GOOGLE叔叔,还有大片的财富纵深领域没有开发,原因是他们在搜索引擎的基础理论纵深处,迷失了方向,还在探索之中。我下面就谈我看到的真正方向,也许它可以在未来八年,指导你们在结婚前成为中国首富。 

  如何在结婚前成为中国首富

  请原谅我用这种不太严肃的题目吸引你们,因为这不是论文,只是专栏文章而已。

  几乎所有第一二代的搜索引擎,好象都还没有从决策成本这个角度考虑下一步的发展问题。而我抛砖引玉提出两个未来学命题。

  命题一:下一代搜索引擎技术,应具有支持感性决策的能力

  眼下前沿的搜索技术,在算法上过于迷信数学算法与逻辑算法。它受制于工程师们典型的洞穴之见,而失于洞察人性。理科出身的人,往往会执迷于人是机器这样的机械论思维,而忽略活生生的市场和人。信息革命既是一场技术革命,又是一场社会革命。因此从一开始,就要具有自然科学与社会科学结合的意识。具体到搜索引擎技术上来说,需要看到机器与人的相同与不同。从相同一面来说,机器与人都具有逻辑运算能力;但不同的是,人有感觉,有直觉,而机器没有。未来搜索引擎有两种并行的趋势,一种是强化理性决策、逻辑运算的能力;一种是转向感性决策,强化以人为本的能力。后者是代表最终方向的。

  对于信息经济这样一种人与技术高度结合的经济形态来说,只从人的机器性这一方面研究财富工具,从下一代的观点看将是非常失败的。还必须从技术人性化角度反向思考问题。这也是我自2000年后在技术界一再倡导人本主义的原因。如果以人为本,搜索引擎的问题就变了。就必须考虑感性决策,或傻瓜化决策的问题。

  技术界有一种非常不好的歪风邪气,就是蔑视经济学、蔑视社会科学的优秀人类文化成果。殊不知,连搜索引擎的下一代方向,都是由这些人文科学工作者首先提炼出来的。从西蒙到卡尼曼,20多年来

诺贝尔经济学奖一直在探索GOOGLE和百度们想破了脑子也突破不了的思维
天花
板,也就是理性的局限性问题。现在基本已经有了一个方向。理解这个方向,已经不能指望GOOGLE和百度等老一辈创业者,下一代搜索引擎的新局面必须由12岁以来的未婚新锐们开拓。

  这个发现简单来说就是,感性选择是对于理性选择的简化。调查表明,大多数经理人都是根据直觉来进行决策的。原因在于,根据完全信息进行理性选择的决策条件,实际不是真实世界所能具备的。人们的思维经常要走捷径。这就是行为经济学的典型结论。思维走捷径,这是下一代经济的典型问题。也就是降低决策成本的问题。直觉就是典型的思维走捷径的常见决策方法。

  根据行为经济学的研究,感性选择是由当下感觉和框架(FRAME)综合作用的结果。正是由于有框架的校正作用,才能保证直觉高于感觉,克服当下感觉的种种偏差。而框架可以在内容上不违反理性,而形式上又呈现非理性形式。

  降低决策成本,是个贯穿整个信息经济的核心问题。搜索引擎服从和服务于这个任务,就必须高度重视通过感性选择方式简化决策的问题。企业信息化、

电子商务和电子政务的本质,都与此有关,都是要让决策者对瞬息万变的环境作出快速直接和高质量的反应。谁反应得快,谁就活下来。老板和上帝有一个共同爱好,就是喜欢简单的决策。不喜欢看一厚本的分析,而喜欢看一页纸的东西。现在的搜索引擎,在这方面,说一窍不通,是表扬他们。实际他们连半窍都不通。

  争夺“框架”,将成为下一代搜索引擎的战略制高点

  既然文科类世界已经看出,感性决策质量的关键在于框架(FRAME)的好坏。12岁的小朋友们可以想象一下,现在赚得稀里哗啦的搜索引擎大叔大哥们,思维盲点恰好在这里,可见你们的机会有多大。

  第一,框架的节点性是框架的生命力所在

  框架相当于一个人的记忆库,用于承载每个人的经历,包括感性的和理性的。每个人的框架都是不同的。互联网革命的本质,就是把权力一步一步移交到分布式的节点上,落到实处,就是把权力交给框架。

  以往搜索引擎还是主从机结构的,没有把权力充分下放到用户本地。这是整个技术无法个性化的根本原因所在。也就是说,搜索引擎还没有从根本上被互联网化。第三代搜索引擎无论如何改进,只要不把搜索重点移向本地,就只能还是第二代技术。

  第二,框架的本质是最终用户语用环境

  搜索引擎蔑视社会科学特别是语言学以及众多学科的语言学转向,直接导致了第三代技术的难产。其中表现在他们对语用问题的陌生上。语用就是上下文环境,一个词的语义,只有放在上下文中,真正的意义才能最后确定。一二代技术的毛病就是脱离了服务对象的特定语言上下文环境,孤立地一个词一个词蛮干。

  框架在第三代搜索引擎中的作用,就是在语形与语义技术的基础上,把搜索请求同个性化的一个人一个人的独一无二的语用环境联系起来,把用户的每次搜索,与这个人的独特经历联系起来,完整准确地把握个性化思想。避免一二代技术搞“两个凡是”的错误。

  第三,框架可能有多种存在和表现形式

  第一种可能的方式是存在于硬盘,通过COOKIE来联接。所以COOKIE问题将成为未来经济的第一制高点。

  第二种可能的方式是托管,也就是变本地存储,为网络存储。这个趋势如何占上风,智能存储技术就会成为制高点。

  第三种可能的方式是桌面。这是微软和GOOGLE的想法。控制桌面,就等于控制了用户的个性化框架数据库。可能成为框架数据库的应用,包括智能文档、邮件。比如谁控制了大邮箱,谁就控制了框架集群。对它们,都要进行智能化处理,即对数据和文档进行元数据处理,我管这叫给文章刷“条形码”。

  第四种可能是交易平台。早期沃尔码的做法是往POS机中内嵌。一般趋势是进行交易的实时监控。而XML语言和更新的RosettaNet标准,为此提供了良好的条件。阿里巴巴将来可以走这条路子。

  第五种可能是移动平台等新兴技术平台。如果手机的存储技术成熟,它也可能成为框架存储器。

  控制以上这些要点,是成为未来搜索引擎技术新星的必由之路。未来的搜索引擎不会象现在这样,脱离本地干活。一定是将搜索要求,与本地框架元数据库进行交换后,换算出最终结果。目前这些地方全都是空白。这里我们还没有谈到搜索引擎本身的语用化问题、自然语言搜索问题等,与上述趋势比较,顶多算值上百亿的细枝末节吧,这里就从略了。有兴趣的可能看我别的文章。

  经过这样一个很不完全的评估,至少可以看到,搜索引擎市场不是饱合了,而是一个洪荒未开的处女地,GOOGLE和百度只不过相当于呼伦贝尔大草原上搭的两个蒙古包而已。未来有待于下一代来创造,而首当其冲的,就是要解放战略想像力。


  爱问(iAsk.com)


评论】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭




科技时代意见反馈留言板 电话:010-82628888-5828   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2005 SINA Inc. All Rights Reserved

版权所有 新浪网