SEO必须了解HTML结构树
作为一个SEOer,必须要知道哪些基本的知识,今天看到2个珠海网友在争论这个问题,有一人说最少要知道HTML相关的标签,而另一个却说不需要知道这些东西,只要会发外链,懂个a标签就行了,据说此人已有2年的SEO实战经验,我真的不知道是现在的SEO门槛太低还是SEOer人员难找。
笔者认为,做SEO必须了解HTML结构树,这点与发外链,逛坛子无关,HTML是互联网的基础,如果你连HTML都不懂,请不要称自己是一个SEOer,最多算你是一个外链专员,想做好SEO,还是建议你好好学习HTML吧。
HTML结构如此重要,这与搜索引擎的工作原理有关,是搜索引擎分析系统的一部分,搜索引擎根据结构化的HTML,通过抽取,运算等算法,取出一个网页对象的5个重要部分:
锚文本
标题
正文标题
正文
正向链接
最后得到的5大属性对搜索引擎检索来讲至关重要,那这5部分是如何抽取出来的呢,这要从HTML的结构树开始说起。
在设计网页的时候SEO人员就应该指导开发人员进行HTML的结构树设置,看下图一简单的HTML结构树。
HTML实际上也是一种xml,其标签都是成对出现的,这个正好被搜索引擎用来做分析数据用。
开始时,检索程序会建立一个栈的结构来存储这个HTML树,而栈是计算机里的一种数据结构,它的特性是先进后出,将所有分析过的HTML标记压入到栈,最后弹出来,通过算法提取出上面的5大属性,然后进一步进行关键词索引,排序等,相对来说,从网页中提取出正文来的算法更为复杂。
因此笔者的观点是一个SEOer必须要了解HTML,知道有HTML结构树的原理,这对自己的SEO能力是有实质性的提高的。