最近一篇《搜索引擎百度已死》(参考《凤凰网·科技》2019年1月22日)的文章把百度推上了议论的高峰,同时也影响了百度的股价。文章说:“最近半年使用过百度的朋友,可能会注意到一个现象:你在第一页看到的搜索结果,基本上有一半以上会指向百度自家产品,尤其频繁出现的是‘百家号’。”
文章的作者举例说:“如果你搜索最近的新闻,比如“英国脱欧”,第一页会出现7条结果,第1条是百度百科,第2、4、5、7条全是百家号的文章,只有两条导向百度以外的网站——第3条是和讯,第6条是新浪。”又如:“搜索“美国政府关门”,第一页的8条结果中有一半是百家号,其中包括第1条和第2条。”还有:“中国2019年的GDP数据昨天公布,我现在(北京时间1月22日上午10点)搜索“中国2019年GDP”,第1、2、4、5条结果全是百家号,其中没有一条能告诉我最新的数据,只有第3条中国经济网的结果是我要找的。”
文章的作者感慨:作为搜索引擎的百度已死。Baidu.com已经不是你寻找中文互联网内容的地方,而是百度自家的站内搜索;它将你引向的不是中文互联网中的优质精神食粮,而是囤积在自家的腐臭变质内容。
对于百度搜索引擎的具体经营方式或经营策略,这里不仔细评论,专家已有一些专题论文,出现《搜索引擎百度已死》这样的文章,令笔者感兴趣的是,中国搜索引擎产业走到今天,收获的成果是值得肯定的,但是,搜索引擎在走出“壮年”的时候,是不是已经失去了创新的锐气,正面临着成熟后的保守子息,固步自封?中国搜索引擎面临着变革了吗?
先看看中国国内目前的搜索引擎的生存状况,目前国内的主流搜索引擎大家是很容易说出来的,主要有:百度、谷歌、搜狗、搜搜,有道、爱问、必应等。此外,还出现了中搜和360搜索。
搜索引擎
就影响力的排名来看,百度稳坐国内第一把交椅,百度占搜索第一的位置这是大众所公认的,它的宣传口号响亮,占用户比例高,网络用户大都知道,想知道什么,就“百度”一下,从中寻找答案。不可否认,目前国内网民中,多数还是选择从百度上去搜索的,百度名头还是比较响。排在第二的是谁呢?本来,谷歌在国际上的搜索地位占据第一是毫无疑问的,但是,在中国大陆,可能是由于“水土不服”,经营一直不起色,2010年1月12日,“谷歌中国”宣布关闭,原本在中国可以占据老二位置的,但因为撤离了,就失去机会了,前一阵有信息传播称谷歌正寻机会重返中国,希望谷歌还能进入中国,毕竟,有竞争才会有质量,搜索引擎业更是如此。搜狗排在第二,但是它的热不起来也没有后退的状态使其在搜索江湖上的地位还是不如百度,搜狗不完全是靠搜索起家的,在一定意义上,它是在搜狐的羽毛下成长起来的,前期,搜狗前期靠搜狐积累了一定的用户量,以后慢慢发展起来,搜狗还有输入法助力,发展到现在也还是有前景的。搜搜是后起之秀,目前占第三,它也曾投入了大量的人力和物力,成为腾讯在搜索引擎业务上挑战百度的业务方向,但从来老二、老三要挑战老大难度都是很大的,暂居第三的搜搜,尽管有QQ的帮助,但依然没有惊喜的进步。
后来,出现了中搜,称是“第三代搜索引擎”,但几年时间过去了,所谓“第三代搜索引擎”的理念还没有被网民接受,想抢搜索这一块大蛋糕,难度还不是一般的小。再后来,360也站出来了,它号称“综合搜索”,但其对网民的影响还有待于提高,360搜索应该发挥其拥有的客户流量和成熟产品的优势,提高其搜索水准,积极抢搜索“蛋糕”。
SEO
那么,当前国内搜索引擎面临什么问题?需要怎样革新呢?
第一,搜索引擎面临这技术创新的挑战,必须积极吸纳科技新成果,提高搜索引擎的科技含量,才能保持前进步伐,特别是要将人工智能、大数据、云计算的最新成果运用到搜索中,着力提高搜索的技术含量。
众所周知,搜索引擎的工作原理是:由一个网络蜘蛛程序抓取互联网上的信息,然后建立索引数据库,当用户查询时,检索器便会按照用户的关键词进行检索,并将检索结果返回给用户。任何搜索引擎,在搜索中都离不开三个系统,即数据来源搜索系统、查询显示系统、搜索引擎管理系统。
搜
首先,数据来源搜索系统主要工作是不断寻找数据,其核心部分是网络蜘蛛程序,它根据人工干预系统预先在检索索引数据库里面存放的种子链接的指令,开始抓取网页,收集网页数据,然后交给抓处信息处理系统处理,而处理过程其实是根据原先提高的链接来找网页的,在下载网页的同时,会识别网页中的超链接,蜘蛛机器人把给定的超链接提交给检索索引数据库,决定哪些链接可以成为新的被抓取的网页地址。显然,搜索活动其实是由人工干预系统制定的规则进行的。这里有两个方面可以提高技术,一个方面是网络蜘蛛程序可以利用网络智能技术,提高其搜索能力和速度,搜得快一些,搜得广一些。另一个是方面是,人工干预的过程可以吸取人工智能的新成果,虽然归根到底仍要靠人工下指令,但是,随着脑科学和新智能的发展,可以将相当部分的人工干预交给机器人负责,人将越来越省事。如此可以提高搜索能力或速度。
其次,还有一个方面可以进行技术提高的,大家知道,经过预处理后的网页,会将其内容打包压缩保存在缓存数据库系统里,而关键在于,保存行动是按照预处理系统分析的结果来保存的,是“分析整理”后的保存。而缓存数据库非常大,它保存的不是一般的数据,而是按照一定编码记录在硬盘上的数据,所以,它的索引系统特别发达,而这个数据库系统的开发,是大有使用高新技术的潜力的。因为,搜索所使用的的缓存数据库,关键不在于查询,而在于分析,分析后的储存才是最重要的,如果能提高储存分析的数据,对于引擎作用的强化是大大有利的。
再次,在搜索过程中,网民在搜索引擎的web页面上输入查询的关键词,web网页接口会将查询关键词,提交给查询分析系统,这个查询分析系统根据“语义学习分析系统”所生成的“最小语境含义表达单位”来分析网民查询的关键词。如果网民查询的关键词就在数据库中,便会被调出来,显示给查询者;而如果不在“最小语境含义表达单位”的库中,就要按照“文字上尽可能多符合”的原则来找出在数据库中的最适合的,才能显示出来。这各环节,对于“最小语境含义表达单位”和“文字上尽可能多符合”的设定机制,可以用利用人工智能和云计算方面的新技术来提高。
总之,新的技术成果正在“结构”着互联网,如果搜索引擎没有积极引进高新技术,就一定会被网络边缘化,搜索,只有与时俱进才有出路。
第二,在经营方式上,搜索引擎要努力摆脱过度商业化的模式,避免纯粹受制于金钱。一个搜索引擎要获得成功,离不开搜索技术、流量、商业模式这三方面的优势。而目前,技术投入可能都有一些,流量上不同的公司有区别,而在商业模式上,基本上都没有摆脱过度商业化的误区。首先,搜索排名由客户花钱来确定,用户搜索关键词后所得到的结果都有很浓的商业色彩,令搜索者非常反感,这严重影响用户的搜索效果和搜索体验。这种金钱至上的经营方式,其实是一种“短视”,过分看重眼前利益,长此以往,用户会渐渐从这一引擎离开,最后,网民会会拒绝使用这样的搜索引擎。搜索的公信力十分重要,搜索内容的真实性、客观性直接影响搜索效果。当然,公司是要盈利的,但是,不能“杀鸡取卵”,而必须在搜索结果的客观性和商业性之间找到有效的,对用户和对经营公司都好的平衡点。适当在搜索的排列上安排商业开发,用户是可以理解的,但是,网民会认可适当的商业化,但是,如果把所有排名都用来收费,那么,就必然难以保证搜索结果的客观公正。最后,该搜索引擎也因过度商业化而被淘汰。现在,网民对搜索引擎过度商业化以及非常厌倦,甚至已经有了敌意,是时候改变了,稳固坚持“唯利是图”的搜索原则,必然毁了自己。
再次,在内容的选择上,要真正坚持多元化和新颖性,搜索原则要更开放更有容纳性。SEO(SearchEngineOptimization)不仅要为网站提供生态式的自我营销解决方案,让其在行业内占据领先地位,更重要的,还要保证搜索内容的多元化和新颖性。如果用户搜到的内容永远是引擎经营商自家提供的内容,或是只有少数几家旧面孔的信息,用户一定会很厌倦,而且会怀疑信息的准确性客观性;同时,如果用户搜到的内容老是那些陈旧的,没有新的解释、信息,那么,用户也会很讨厌。搜索就是为了获取新知识,如果经营商为了商业利益,为了为特定的关联商进行宣传推广,老是在“炒剩饭”,影响网民的搜索体验,网民一定弃搜索引擎而去的。在信息高度发达的今天,信息流量大,更新快,搜索引擎要在技术上、经营态度上和内容安排的原则上,适应这一特点,让搜索内容更新颖,这才能满足用户的需要。
搜索引擎已经成熟了,但成熟之后面临着对原有经营原则的变革,面临着对利益理解的旧观念的改变,也面临着高新技术的挑战,如果不变革,搜索引擎真的要衰落了,技术在日新月异的进步着,经营方式在不断更新,搜索引擎经营的“老套子”不灵了,蜕变是必须的,但愿搜索引擎业,能蜕去旧皮,洗心革面,迎接新时代。