SEO必须了解HTML结构树

admin8年前 (2013-12-07)SEO优化259

作为一个SEOer,必须要知道哪些基本的知识,今天看到2个珠海网友在争论这个问题,有一人说最少要知道HTML相关的标签,而另一个却说不需要知道这些东西,只要会发外链,懂个a标签就行了,据说此人已有2年的SEO实战经验,我真的不知道是现在的SEO门槛太低还是SEOer人员难找。

笔者认为,做SEO必须了解HTML结构树,这点与发外链,逛坛子无关,HTML是互联网的基础,如果你连HTML都不懂,请不要称自己是一个SEOer,最多算你是一个外链专员,想做好SEO,还是建议你好好学习HTML吧。

HTML结构如此重要,这与搜索引擎的工作原理有关,是搜索引擎分析系统的一部分,搜索引擎根据结构化的HTML,通过抽取,运算等算法,取出一个网页对象的5个重要部分:

  1. 锚文本

  2. 标题

  3. 正文标题

  4. 正文

  5. 正向链接

最后得到的5大属性对搜索引擎检索来讲至关重要,那这5部分是如何抽取出来的呢,这要从HTML的结构树开始说起。

搜索引擎从html结构树提取元素

在设计网页的时候SEO人员就应该指导开发人员进行HTML的结构树设置,看下图一简单的HTML结构树。

html结构树

HTML实际上也是一种xml,其标签都是成对出现的,这个正好被搜索引擎用来做分析数据用。

搜索引擎分析html树

开始时,检索程序会建立一个栈的结构来存储这个HTML树,而栈是计算机里的一种数据结构,它的特性是先进后出,将所有分析过的HTML标记压入到栈,最后弹出来,通过算法提取出上面的5大属性,然后进一步进行关键词索引,排序等,相对来说,从网页中提取出正文来的算法更为复杂。

因此笔者的观点是一个SEOer必须要了解HTML,知道有HTML结构树的原理,这对自己的SEO能力是有实质性的提高的。

相关文章

百度MIP效果演示及站点改造资料

百度MIP效果演示及站点改造资料

8月21号,第一时间给大家介绍了百度的MIP计划,相信SEO人员对MIP计划都有所了解了,短时间内应该还没来得及动手改造网站。继续关注百度的MIP,手机搜索“百度MIP" ,可以看到搜索结果...

seo网址收录策略

seo网址收录策略

一个网站,通常为说,首页和分类页面收录是没有问题的,当然被K站或惩罚的除外。在网站建立初期,Seoer要考虑的是如何引导蜘蛛去爬行,如何让Google,百度收录网站?SEOer都知道网站的内部链接结构...

搜索引擎如何提取正文

搜索引擎如何提取正文

还是延续上一篇两个"珠海SEO"所争论的问题,SEO必须了解HTML结构树,此文中介绍了搜索引擎是如何提取网页Title的,那网页的正文又是如何提取的呢?对于网页正文的提取方法就比...

百度的天网算法有什么用

百度的天网算法有什么用

今天在百度站长平台看到百度的最新动态,“天网算法”出台,百度严打盗取用户隐私。近日,百度网页搜索发现部分站点存在盗取用户隐私的行为,主要表现为网页嵌恶意代码,用于盗取网民的QQ号、手机号。而许多网民却...

url包含中文不利于搜索引擎收录

url包含中文不利于搜索引擎收录

url包含中文不利于搜索引擎收录,珠海SEO在优化网站的过程中深深体会到了。早期的想法认为百度是中国人的搜索引擎,应该会支持中文的吧,事实证明我错了,百度也不喜欢URL含有中文。两个URL,一个含有中...

什么是网站降权,百度降权行为分析

什么是网站降权,百度降权行为分析

什么是网站降权,百度降权行为分析?网站降权,SEOer最怕网站被降权了,那么什么是网站降权呢?网站降权是指搜索引擎对网站评定的级别下降,是搜索引擎对网站进行的一种处罚方式。通常多为网站自身作弊导致的,...

评论列表

互传电商网
6年前 (2015-07-18)

黯相望,断鸿声里,立尽斜阳。

肖振杰博客
6年前 (2015-03-18)

文章不错,可是网站内容没有更新啊。

运气不好怎么转运
7年前 (2014-11-13)

我又来看你啦。

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。