今天,还有一种所谓的“搜索”也被贴上了“垂直搜索”的标签,最典型的是火车票和机票。在笔者看来,这些业务根本就不是搜索,而只是检索。判断依据就是所查询的信息是不是海量,信息是不是结构化。
火车车次,航班班次(含折扣价)的数据是有限的,而且发生变动的频率也就是一年一两次,其信息量远远未到可供“搜索”的地步。从国内网站来看,提供火车票、机票搜索的网站不计其数,其差别不是检索技术的高低,而是数据库更新是不是及时。
从技术角度来看,在获得权威数据库之后,开发一个基于SQL语句的WEB查询功能只需要几个工作日的时间,和布林佩奇和李彦宏做的搜索可谓天壤之别。当然,一个SQL开发高手想到百度谋得一职也是幻想。
技术开发十分简单的本质原因,是因为机票车票这些信息都是结构化的,检索过程可以依赖现有技术,而不用自行开发极度复杂的HTML文本搜索技术。
诸如火车票机票的专业查询还有很多,比如医学方面的病历查询,警方所用的在逃犯检索,以及网上零售网站的商品检索。这些都不是现代意义上的搜索引擎,称之为“垂直搜索”可能是想沾点搜索引擎的“时髦”。
综上所述,在目前这一代的搜索技术之下,我们暂且按照信息媒体的类型来对搜索分类,这种分类谈不上所谓的“垂直化”。而许多号称“垂直搜索”的服务其实是毫无技术含量的“检索”。
需要强调的是,搜索的目标是用复杂的算法和分布式计算技术从海量非结构化信息中找出用户最想要的东西。迟来的搜索业者如果对于“算法”和“计算”没有自信,就干脆不要把海量信息的分门别类当成自己的事业,美国Google和中国百度的进步迟早会让这种低技术含量的工作变成无用功。 (令狐达评论)