2009年2月,Google、雅虎 、微软共同发布了一个新的标签:canonical,用于解决网址规范化的问题。当我们的同一个页面可以通过多个URL来访问的时候,可以通过canonical标签来实现访问最规范化的网址。
canonical标签是一种告诉搜索引擎您要在搜索结果中显示哪个版本的URL的方法。使用canonical标签可以防止由于相同(或非常相似)或“重复”内容出现在多个URL上而引起的问题。
这种重复的内容可能是多种形式出现的,包括:
1. 可在URL中添加或不添加“ www”前缀的网页
2. 可通过“ HTTP”和“ HTTPS”协议访问网页
3. 同一样目下的多个列表页。
如果出现多个不同的URL地址访问到的页面都是首页,这时就可以使用canonical标签来规范首页网址,假设统一规范为https://example.com,这时就需要在其他3个页面head标签内加上下面的一段代码:
<link rel=”canonical” href=”https://example.com”>
就像上面举例一样,我们常常会遇到这个问题,特别是一个带www,一个不带www的网址。通常最简单的方法是通过301重定向来确定我们的首选域;如果在能力或技术限制的情况下,使用canonical标签来规范首选域网址也是一个好的方法。
建议:能通过301重定向确定首选域,最好使用重定向比较好;迫不得已的情况下,才使用canonical来实现。
有的时候我们会遇到这样的一种情况,就是同样的一个网页有多个访问入口,虽然页面已经经过了伪静态化处理,但是很容易造成一个页面对应多个入口的情况,一个是自身动态URL,另一个是伪静态化处理过的静态URL,这时可以通过canonical标签来规范网页。
很多网站,特别是大型网站,会对网页设置一些跟踪参数,通过不同的路径访问,同一页面会出现多个版本的URL,这时也可以通过canonical标签来规范网址。
很多商城网站的产品很多都相似,甚至只是商品颜色不同,但内容完全相同,这会导致高度的重复页面。针对这种情况,我们也可以使用canonical标签来规范网页。
1. 使用canonical标签使网址规范化;
2. 避免内容重复页面,使搜索引擎收录更准确;
3. 集中传递页面权重。
不是,这个标签只是一种建议,不是指令。虽然搜索引擎蜘蛛会在很大程度上参考这个标签,但是不一定百分之百遵守,特别是百度。搜索引擎还是会参考其他情况来判断。这可以防止站长有可能把标签里指定的规范化网址写错。
都可以,但通常建议使用绝对地址。
指定的规范化网址上的内容,与其他使用这个标签的非规范化网址内容要完全相同或高度相似,否则很有可能会不起作用。而使用301重定向没有这个限制。如果错误使用canonical标签,一旦搜索引擎发现网站上有一个canonical标签有问题,很有可能整个网站上所有的此标签都不会得到信任。