欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

事事总关“搜” 博客分类: All About Soft 搜索引擎Google数据挖掘网络应用互联网 

程序员文章站 2024-03-23 11:13:52
...

        最近在看《搜》这本书——The search的中文版,书不算厚,内容本身很吸引我,而翻译也相当到位,阅读起来自然也就赏心悦目了。这本书的内容,我想就不需要作什么介绍了,估计十个朋友有九个都能猜出这本书大致的内容。对,就是一本讲述Google的书。Google的事业如日中天,与Google扯上关系的出版物也不在少数,像《搜主义:Google持续成长的秘密》《Google成功的七堂课》也是让我在书店为之驻足的书籍。但是在这些与Google相关的书籍当中,《搜》更能够吸引我,因为她讲述的不仅仅是Google,更多的是搜索本身。从书中,我可以了解到Alta Vista——前Google时代最成功的搜索引擎,也知道了Google成功的商业模式并非是她自己的发明,而是来自于Goto.com(Overture的前身)。除了这些让人津津乐道的故事之外,书中还对搜索带来的价值作了深入而详尽的分析,而这部分才是最有价值的内容。

        我们都知道,现在网络的信息是极为庞大而过剩的,而且它每天都在以非常惊人的速度增长着。人们面对这样浩如烟海的信息,如何才能找到对自己有用的信息呢?答案就是搜索。有了搜索,我们不需要在链接的海洋中漫无目的四处游弋,因为一个个关键词就代表着自己的方向,也代表着自己的目的。搜索引擎在为一个个关键词提供相应的匹配结果的同时,也记下了人们的兴趣与欲望。基于此,网路的流量就得到了分化,从而流量的价值也就得以凸现。正如书中所说的,“未分化的访问流量几乎毫无价值,但是特别的访问流量却非常有价值,因为其中包含有同该公司的商品和服务有关的行为意图。”我开始明白为什么几乎每个网站都会提供搜索的功能,我想除了为用户提供更加便捷的直达所需服务之外,更重要的,可以从搜索数据中获取用户的喜好与需求,这就是搜索引擎的双重角色吧。因此,一个搜索引擎仅仅提供搜索服务,而没有包含数据挖掘的功能,那么这只能算作一个半成品的,甚至是价值甚微的搜索引擎。在用户提交的一次次搜索请求中,本身的用户行为就蕴含着非常有价值的信息,缺少了数据挖掘功能的搜索引擎无疑是丢掉了一座金矿。商家都不是*,面对着金矿怎么可能视而不见呢?Amazon提供的"Customers who bought this item also bought"推荐功能就是一个很好的例子,与之类似的还有豆瓣的推荐功能:“豆瓣猜你会喜欢”以及“喜欢某某的人也喜欢”。Amazon通过推荐功能为其带来了更多的收入,而豆瓣的推荐功能虽然不见得在收入上能够发挥多大的作用,但是让用户得到了更好的体验——系统能够对一定数量用户的行为进行分析与总结,再结合某个用户的行为特点得到了一个对用户相当有用的推荐列表。这就是对访问流量进行分化所带来的价值。

        我们可以从一个更加技术性的角度看待用户访问流量分化的问题。由于HTTP协议本身是无状态的,在那个只有HTML静态页面的年代,服务器并没有什么义务记住每个用户,因为她能够提供给用户的内容是无差异的。在那个时候,个体并没有受到重视,群体的行为才是最重要的。随着商业需求的日益提高,为了让每一个用户在访问网站的时候感到宾至如归,包含动态网页的Web应用技术出现了,随后大行其道。说到了这里,我还是得明确一个概念:这里的动态不是指充满Flash动画的网页,而是指相同的URL对应的网页内容会根据不同的请求而发生变化。当网站能够通过诸如Cookie、Session这样的技术对用户个体进行区别对待的时候,当用户终于可以在网站上大声喊出自己就是张三李四而甚感惬意的时候,当流量就是网站实力的唯一指标的时候,网络对于个体的关注也到了极致。然而,很多事物就是在平衡的两端迂回地发展,互联网再次关注起群体的行为,而这一次,群体用户行为的细分使得一个个区分开来的群体更加有凝聚力,也更加具有商业价值。这样的群体拥有足够的共性,大家因为某个因素(或是兴趣爱好,或许商业需求)而被网络上的各个系统组织到了一起,不管这样的组织是紧密还是松散的。在这些能够对用户访问流量进行分化的工具当中,搜索引擎无疑是最重要的利器。人们利用搜索引擎寻找自己感兴趣的信息,同时也不自觉地告诉了搜索引擎:“我需要这些。”所以,搜索引擎不能缺少快捷准确的服务,更不能缺少对用户行为的分析,用户信息的挖掘。

        一言以蔽之,搜索让用户获取信息的方式从被动变成了主动,而在这主动当中就蕴藏着用户的需求。我们知道忽视了用户需求的软件系统注定是不能成功的,而搜索引擎关注于用户需求的分析,也就造就了搜索今日的辉煌。