文/朔土
美国著名的数字媒体评估公司Jupiter Media Metrix日前发布研究报告称,“搜索引擎公司推出的付费添加服务是一个正在兴起的、前景光明的因特网领域,相对于目前低迷的在线广告市场来说,它的发展潜力是非常巨大的。”众所周知,搜索引擎作为因特网上仅次于电子邮件的第二大常用服务,各大网站也把收费搜索引擎作为新的增长点,但做为收费产 品,现在的搜索引擎技术是否过硬?记者9月6日采访了国内搜索引擎主要提供商之一蓝帆科技的技术总监成芳女士,成芳称作为作为收费产品搜索引擎的技术还有许多有待改进之处。
某网站现在推出登录收费业务收费标准是1500元人民币每年,该网站一位负责人称此价格太低了将来肯定会有所提高。成芳认为目前的搜索引擎收费服务还只是初级阶段,还不好判断目前价格水平的高低,“只有能保证稳定的服务水平时才好判断价格的高低”。成芳认为现在只是搜索引擎收费服务的起步阶段,只有随着提高产品质量和服务水平的提高,市场才会有大的增长空间。
作为企业从事因特网推广的最重要途径,搜索引擎注册一直是网站推广的基本手段,甚至曾经一度被认为是网络营销的核心内容。企业网站一般会通过搜索引擎达到如下目的:一、企业可以在同行业的分类目录中找到自己和竞争对手的网站;二、企业在互联检索某一类产品或服务时可以找到自己和竞争对手的网站;三、知道企业名称的普通用户可以方便的查到企业网址;四、有具体产品或产品信息需求的普通用户可以在企业结果中选择所要联系的企业。而目前搜索引擎提供的服务是否能稳定的提供这些服务呢?成芳认为在技术还有许多有待改进之处。
搜索引擎常出现的问题
成芳说:“如果没有搜索引擎,我们都会迷失在辽阔的信息海洋中。但是,有些时候,不管用户掌舵是多么的老练,搜索引擎可能不是帮助用户自由的冲浪,而是让用户迷航。”搜索引擎的失败包括从搜索到几十万几百万的无关结果,到搜索不到任何结果,以及这两个极端之间的各种不同程度的失败。只有提高目前搜索引擎的技术水平,才会避免下面搜索中经常遇到的问题。
最常见的搜索失败是,搜索结果可能是检索到几百万个相关网页,“也就是搜索引擎没有帮用户找到草堆中的那根针,而是给了用户整个草堆。”还有就是没有找到任何相关网页,虽然这种情况不算多,但搜索引擎有时确实不能按用户的搜索要求找到任何内容。再有就是点击搜索结果,却得到“404-Not Found"错误。成芳说这种情况通常是因为网管象整理自己的硬盘一样整理网站,把所有混乱的文件起上规范的名字,然后搬到整整齐齐结构清晰的文件夹中。当文件被移动或重新命名后,收藏这个文件的每一个书签,搜索引擎指向这个文件的每一个链接,以及指向这个文件的每一个被发表的链接,就都作废了。这种欠考虑的“整理”在网络上制造了远比计算机失灵更多的混乱。“这是网管犯的最愚蠢的错误之一,但也是相当常见的错误。”还有就是很多时候我们会发现上次能搜到的内容,这次却搜不到了。成芳表示这是搜索引擎现有的技术弊病之一:“搜索引擎永不停息的从它们的索引库中抛弃已索引的网页。有时是成千上万的网页。所以有时这些被遗弃的网页会重新出现在索引库中,有时则不会。”
搜索引擎的工作原理
搜索引擎的数据库资源由用户提交的登录信息组成,他们还主动地使用其"Web crawlers" "spiders" 或 "robots"程序搜索因特网并将搜索到的网页信息归入其索引数据库中。这些程序根据网页链接进行搜索,如从一些服务器上的链接表开始,顺着这些链接去发现新的网页并加入数据库。这样,搜索引擎也倾向于先搜索一些很流行或很大型的网站,这些网站提供大量的链接。Web crawler在找到一个网页后,将其标题及URL存储并返回数据库,或对HTML源代码进行分析后归总返回数据库。网站所有人也可以通过在线登录提交网址,登录成功的时间一般在6到8周左右。而且,一个站点登录成功后,可能会在2到3个月后便消失在搜索引擎中,如果用户的网站更新太慢,而大多数搜索引擎都会定期对数据库中的URL进行是否有更新的查核。搜索引擎有至少三个因素值得重视:数据库,用户搜索,搜索结果排序。而现在的搜索引擎收费服务主要方式就是提高排名位置。
收费前搜索结果排名规则
“当用户在搜索引擎上进行搜索时,搜索引擎会根据输入的搜索条件在其数以百万计的网页数据库中进行搜索,并将搜索结果返回给用户,而与用户的搜索条件最相关的结果将出现在前面的位置。当然搜索引擎也有出错的时候,一些不相关的网页有时也会出现在搜索结果里。虽然就大多数时候而言,搜索引擎的搜索准确度还是很高的。”
搜索引擎的缺点是不可能针对用户的要求再耐心的问用户几个问题而确定用户到底想要查找什么。也不能依靠判断或是以前搜索的经验。所以在收费前搜索结果排名规则,是按搜索引擎对结果的相关性判断。搜索引擎排名的主要法则是关键字,关键字在网页中的位置及出现的频率,也就是位置频率法。位置与频率的关系是,例如用户要求一个图书管理员找一本有关“旅游”的书,他会先去看了那些书名里有“旅游”这两个字的书。搜索引擎也是一样,如果网页的标题含有关键词,那么搜索引擎会将其相关性的级别提高。搜索引擎也会查看网页文本里的关键词情况,比如文本内容的第一段的标题,或前几行中有没有关键词出现。如果出现了关键词,网页的相关性级别自然又有所提高。
关键词出现频率也是搜索引擎判断网页相关性的主要依据之一,在网页中关键词出现的次数越多,网页的相关性级别就越高。几乎所有的搜索引擎都遵循位置频率法则,但厨师在作烹饪时虽然遵照的是菜谱,但也会自己去加些佐料罢,搜索引擎也是这样,它们会在位置频率法则的基础上加一些自己的法规,这也是每个搜索引擎对同一个搜索条件返回的搜索结果都不一样的原因之一。
收费之后的搜索引擎
至于收费是否会影响到用户的检索效果,成芳认为,对企业的收费本身不会影响各门户站点网站收录质量和用户检索结果,但是会督促网站提高搜索引擎本身的目录质量,“过去很多网站使用的搜索引擎都是自己开发的、专用的,投入大而效果却不一定好”。在市场进一步的开发下,对搜索引擎的服务质量的要求肯定也会越来越高,网站自己开发搜索引擎技术也不符合资源优化和成本优化,所以将来的趋势肯定是由少数的搜索引擎应用服务提供商来提供引擎技术。这样网站才有肯能在节省开发投入的同时降低了更新维护的成本,而使服务的质量到提高。
   手机铃声下载 快乐多多 快来搜索好歌!       新浪企业广场诚征全国代理
|