一直以来网址URL的规范化(URL canonicalization)是影响网站收录以及进行整站优化的关键所在,他所指的是搜索引擎在对网站挑选最佳合适的URL路径作为真正收录网址,或许指向这个页面的站内URL有很多,但是引擎只会去挑选其中一个进行收录排名。下面我们来举例说明: http://www.seorobots.cn http://www.seorobots.cn/index.html http://seorobots.cn http://seorobots.cn/index.html
如果站在SEO的角度去分析,这四个URL的是完全不相同的,但通常情况下他们也可以说是相同的文件,也可以通过技术手段使其4个URL访问的是不同的4个文件内容,在搜索引擎一方规范网站网址时,它仅仅会挑选其中一个URL作为网站的正规首页,通常来说首页在引擎当中所访问的页面是固定的一个,但是有的做SEO的朋友们喜欢在布置内部链接时,有时指向的是http://www.seorobots.cn, 而有时有选择http://www.seorobots.cn/index.html, 虽然这一点在访客的角度来说它们都是同样的文件,但是站在SEO的角度来分析,引擎会因而产生困惑,究竟哪个URL是它真正的首页呢?假如这两个URL都有着不少的链接,引擎或许会将两个URL同时入库,久而产生了站内镜像网页。(站内镜像网页:一个网站内,两个相同内容的网页,URL不相同)站内镜像网页有时会直接影响网站的排名按作弊手段处理,即使不去处理,再引擎考虑其排名时也会受到不同程度的干扰。
因此在建站时就应该考虑站内URL的规范化,使其避免发生这一现象。 |