朋友送我一本书,走进搜索引擎
SEO好友送我一本书——《走进搜索引擎》,该书由清华大学三个博士生所著。书中一针见血的指出了搜索引擎成功的5大需求,快、全、准、稳、省,并且阐述了搜索引擎的4大体系:下载系统、分析系统、索引系统、查询系统。
笔者在珠海做SEO也有好多个年头了,林林总总的经历过大大小小的网站,也积累了一些SEO的经验知识。然而在我看完这本书后,深切的让我感觉到,以前很多不明白的问题,现在都有了答案,有种豁然的感觉。
搜索引擎从宏观的角度可以分为在线系统和离线系统,在线系统也就是当用户进行搜索这个动作时,搜索引擎需要毫秒级的访问速度,但是离线系统就没有太强的时间约束,有可能是几天,几周,也可能是一月。
搜索引擎的职责就是从互联网上放出蜘蛛,从一个网页爬向另外一个网页,然后通过下载系统进行下载,然后通过分析、索引到放入索引库,搜索引擎会尽可能的处理最多的页面,当然这只是理想状态,原因在于搜索引擎的需求里面有一个”省“,搜索引擎的高消耗,是众所周知的,电,宽带,物理设备这些都决定了搜索引擎不可能爬到互联网的每一个角落。
书中将万维网比喻成一个蝴蝶结,爬虫会随着蝴蝶结的左端或者中间开始执行爬行命令。这些爬虫会根据网页的抓取原理,Robots协议、去重策略等形成网页库,从而为在线查询作好准备。
刚拿到此书,才看完二章,由于现在工作的关系时间比较紧张,阅读时间基本都在公交车上,感谢好友冯常瑞给我提供了下班时的精神食粮,希望我们在SEO路上走得更远。