朋友送我一本书,走进搜索引擎

admin11年前 (2013-11-05)SEO优化463

SEO好友送我一本书——《走进搜索引擎》,该书由清华大学三个博士生所著。书中一针见血的指出了搜索引擎成功的5大需求,快、全、准、稳、省,并且阐述了搜索引擎的4大体系:下载系统、分析系统、索引系统、查询系统。

笔者在珠海做SEO也有好多个年头了,林林总总的经历过大大小小的网站,也积累了一些SEO的经验知识。然而在我看完这本书后,深切的让我感觉到,以前很多不明白的问题,现在都有了答案,有种豁然的感觉。

搜索引擎从宏观的角度可以分为在线系统和离线系统,在线系统也就是当用户进行搜索这个动作时,搜索引擎需要毫秒级的访问速度,但是离线系统就没有太强的时间约束,有可能是几天,几周,也可能是一月。

搜索引擎的职责就是从互联网上放出蜘蛛,从一个网页爬向另外一个网页,然后通过下载系统进行下载,然后通过分析、索引到放入索引库,搜索引擎会尽可能的处理最多的页面,当然这只是理想状态,原因在于搜索引擎的需求里面有一个”省“,搜索引擎的高消耗,是众所周知的,电,宽带,物理设备这些都决定了搜索引擎不可能爬到互联网的每一个角落。

image

书中将万维网比喻成一个蝴蝶结,爬虫会随着蝴蝶结的左端或者中间开始执行爬行命令。这些爬虫会根据网页的抓取原理,Robots协议、去重策略等形成网页库,从而为在线查询作好准备。

刚拿到此书,才看完二章,由于现在工作的关系时间比较紧张,阅读时间基本都在公交车上,感谢好友冯常瑞给我提供了下班时的精神食粮,希望我们在SEO路上走得更远。

相关文章

搜索引擎如何提取正文

搜索引擎如何提取正文

还是延续上一篇两个"珠海SEO"所争论的问题,SEO必须了解HTML结构树,此文中介绍了搜索引擎是如何提取网页Title的,那网页的正文又是如何提取的呢?对于网页正文的提取方法就比...

最全的seo作弊手法

最全的seo作弊手法

作为专业的SEO人员,我一直反对黑帽SEO,反对SEO作弊行为,始终提倡白帽SEO,因为急功近利采取一些极端的手段,是不可取是要付出巨大代价的,有太多的网站就因为采用了SEO作弊手段,最终导致K站。S...

本站robots.txt文件的书写实操

搜索引擎来到网站时,会先查看网站的目录下是否存在robots.txt文件,如果存在,搜索引擎就会抓取robots.txt文件的内容,根据指令做出相应的爬行动作,查看百度的robots文件http://...

SEO优化之使图片映射

很多SEOer都建议不要用图片做导航,尽量少用图片,原因大致就是图片不利用索引等等。但是当我在网络上看到很多优秀的网站后,发现事实上并非如此,网站因图片而美,网页设计者们避免不了的需要使用图片,只要图...

2013年终百度算法调整后,珠海SEO网站上第一位后的感想

2013年终百度算法调整后,珠海SEO网站上第一位后的感想

珠海SEO网站一直在百度的审核期中,前几天,也就是2013年的最后几天,经过百度算法动荡后,珠海SEO网站浮出水面,一举排上百度首页第一位,其实在很早之前,珠海SEO就一直在谷歌搜索中排第一位。这个结...

珠海SEOer2016年的网站优化方案

珠海SEOer2016年的网站优化方案

又在珠海度过了新的一年,作为一个SEO,也该为新的SEO任务制定计划了,总结下2016的重点优化思路,当然这在只说白帽seo。1、网站url要有规律并且稳定对于刚很多刚开始做网站的人来说,由于最初情况...

评论列表

杨伟
杨伟
8年前 (2016-08-16)

这个家伙很牛逼,博客做的不错

新青年摄影
10年前 (2014-08-02)

书中自有黄金屋

admin
10年前 (2014-05-14)

已加您QQ,多多交流!

江西seo
10年前 (2014-05-03)

博主的网站做的不错,值得学习,可以和博主交换一下友情链接吗,江西http://www.seo-longfei.com/我的QQ:2842993592,希望可以和博主成为朋友,交流seo的知识

admin 回复:
已加您QQ,多多交流!
10年前 (2014-05-14)
remo
remo
10年前 (2014-04-16)

楼主加油!

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。