SEO必须了解HTML结构树

admin8年前 (2013-12-07)SEO优化315

作为一个SEOer,必须要知道哪些基本的知识,今天看到2个珠海网友在争论这个问题,有一人说最少要知道HTML相关的标签,而另一个却说不需要知道这些东西,只要会发外链,懂个a标签就行了,据说此人已有2年的SEO实战经验,我真的不知道是现在的SEO门槛太低还是SEOer人员难找。

笔者认为,做SEO必须了解HTML结构树,这点与发外链,逛坛子无关,HTML是互联网的基础,如果你连HTML都不懂,请不要称自己是一个SEOer,最多算你是一个外链专员,想做好SEO,还是建议你好好学习HTML吧。

HTML结构如此重要,这与搜索引擎的工作原理有关,是搜索引擎分析系统的一部分,搜索引擎根据结构化的HTML,通过抽取,运算等算法,取出一个网页对象的5个重要部分:

  1. 锚文本

  2. 标题

  3. 正文标题

  4. 正文

  5. 正向链接

最后得到的5大属性对搜索引擎检索来讲至关重要,那这5部分是如何抽取出来的呢,这要从HTML的结构树开始说起。

搜索引擎从html结构树提取元素

在设计网页的时候SEO人员就应该指导开发人员进行HTML的结构树设置,看下图一简单的HTML结构树。

html结构树

HTML实际上也是一种xml,其标签都是成对出现的,这个正好被搜索引擎用来做分析数据用。

搜索引擎分析html树

开始时,检索程序会建立一个栈的结构来存储这个HTML树,而栈是计算机里的一种数据结构,它的特性是先进后出,将所有分析过的HTML标记压入到栈,最后弹出来,通过算法提取出上面的5大属性,然后进一步进行关键词索引,排序等,相对来说,从网页中提取出正文来的算法更为复杂。

因此笔者的观点是一个SEOer必须要了解HTML,知道有HTML结构树的原理,这对自己的SEO能力是有实质性的提高的。

相关文章

最全的seo作弊手法

最全的seo作弊手法

作为专业的SEO人员,我一直反对黑帽SEO,反对SEO作弊行为,始终提倡白帽SEO,因为急功近利采取一些极端的手段,是不可取是要付出巨大代价的,有太多的网站就因为采用了SEO作弊手段,最终导致K站。S...

SEO问答一:死链接是什么?如何处理死链接?

SEO问答一:死链接是什么?如何处理死链接?

死链接分协议死链,内容死链,跳转死链。 协议死链是指通过HTTP协议状态码明确表示网页已无阅读价值。百度站长建议协议死链为404代码,即未找到文件。请尽量不要用其它状...

特征权重计算——逆文档频率因子

特征权重计算——逆文档频率因子

什么是逆文档频率因子,简称IDF,IDF反映了在文档集合中一个单词对一个文档的重要性,经常在文本数据挖据与信息提取中用来作为权重因子。在一份给定的文件里,词频(termfrequency-TF)指的是...

Google的AMP项目

Google的AMP项目

一直关注SEO行业的动态,最近Google的AMP项目已开始试运行,并且收效良好。什么是Google的AMP项目,AMP,Accelerated Mobile Pages,译意大致是”加速的移动页面”...

朋友送我一本书,走进搜索引擎

朋友送我一本书,走进搜索引擎

SEO好友送我一本书——《走进搜索引擎》,该书由清华大学三个博士生所著。书中一针见血的指出了搜索引擎成功的5大需求,快、全、准、稳、省,并且阐述了搜索引擎的4大体系:下载系统、分析系统、索引系统、查询...

网站优化过度的处理

网站优化过度的处理

这几天发现博客有被惩罚的迹象,似乎是优化过度,冷静下来想了一下可能引起的原因。因为我平时比较忙,并不能每天都去照看网站,所以网站更新频率比较低,要查找优化过度的原因也较容易。相信自己是找到了症结所在,...

评论列表

互传电商网
6年前 (2015-07-18)

黯相望,断鸿声里,立尽斜阳。

肖振杰博客
7年前 (2015-03-18)

文章不错,可是网站内容没有更新啊。

运气不好怎么转运
7年前 (2014-11-13)

我又来看你啦。

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。