返回文章列表
SEO

什么是规范标签?为什么规范标签解析对 SEO 很重要?

西伊
2025-12-04
20分钟前
什么是规范标签?为什么规范标签解析对 SEO 很重要?

规范标签有助于防止重复内容问题,从而损害你的 SEO。

以下是它们的工作原理以及何时使用。


什么是规范标签?

规范标签(rel=“规范”)是一段 HTML 代码,当存在相似或重复的 URL 时,用来告诉搜索引擎哪个页面版本是主要的。这有助于确保只有主版本被索引。


这里有一个典型标签示例:

<link rel="canonical" href="https://example.com/" />

你指定的 URL 是你想索引的页面的主版本。


什么时候应该使用规范标签,为什么它们对 SEO 如此重要?

当你在多个 URL 上有相同或相似的内容时,应该使用规范标签。

以下是导致这种情况的众多原因中的几个:

  • 你在带有斜杠和无斜杠的 URL 上存在重复内容 (例如 example.com/ 和 example.com)
  • 桌面和移动端页面(例如 example.com 和 m.example.com)都有重复内容。
  • 你在 URL 的参数化版本( 例如,example.com 和 example?tracking-code)处有重复内容。

顺便说一句。如果你在其他网站上转发或转载内容,这也是使用规范标签的另一个时机。如果不这样做,谷歌可能会将联合发布或再发布的内容视为原版,并在搜索结果中排在你网站之前。

举个例子,假设你有一个电商商店销售小部件。你可能会有一个分类页面,列出所有蓝色小部件,地址是:example.com/widgets/blue/。但当访客使用产品筛选时,可能通过这样一个丑陋的网址访问完全相同的内容: example.com/widgets?color=blue

除非你指定规范,否则“错误”的 URL 版本可能会被索引并出现在搜索结果中。

规范标签还帮助确保排名信号如链接集中到一个页面。这很重要,因为链接是谷歌排名的确有据可考的因素 ,而且链接和流量之间有很强的相关性。

重复内容过多还会消耗“爬取预算”,这正是谷歌浪费资源爬取内容的重复版本,而非你真正想被索引的新页面。当然,它最终可能会发现不应该经常爬取页面,但它必须先爬行页面才能做到——这正是爬取预算的浪费。


如何为您的网站添加规范标签

你可以通过在页面代码中的 <head> 部分手动添加 <link rel="canonical" href="https://example.com"/> ,但几乎没人这么做,因为太麻烦了。通常通过你的网站平台来做会容易得多。

无论你选择如何进行,务必遵守以下黄金法则:

  1. 使用绝对网址。 谷歌说不要使用相对网址(例如 /sample-page/),尽管它们是支持的。这意味着你应在规范标签中指定完整的绝对 URL(例如, https://example.com/sample-page/ )。
  2. 使用正确的域名。 如果你已经切换到 SSL(现在应该已经切换了!),确保你的规范标签中不要声明任何非 SSL(即 HTTP)URL。这样做可能会导致谷歌感到困惑和意外结果。
  3. 每页只指定一个规范。 如果你声明了多个 规范,谷歌会忽略所有声明的规范。

让我们来看看几个热门平台的流程。

在 WordPress 中设置规范标签

安装 Yoast SEO,然后滚动到页面或帖子的“高级”部分,你会看到指定典范的选项。


在 Wix 中设置规范标签

请按照他们的逐步指南作。相比 WordPress,这有点复杂,但还是可行的。

在 Shopify 中设置规范标签

Shopify 开箱即用的规范化处理得相当不错。这是不是意味着它总是完美的?不。但大多数中小型商店可能不需要手动添加规范标签。如果需要,我建议寻求开发者的帮助,因为你需要直接编辑主题代码(.liquid 文件)。

在方形空间中设置规范标签

进入页面的高级设置,你可以在标题中注入规范标签。


其他声明规范 URL 的方法

规范标签并不是声明页面规范的唯一方式。你还可以使用另外三种方法:

  1. 重定向
  2. HTTP 头部中的 rel=“canonical”
  3. 网站地图

顺便说一句。如果这些都不被使用,谷歌会依赖其他信号,如 hreflang、 内部链接和 URL 长度,来为你选择一个标准信号,如果它认为你有重复内容。

重 定向

谷歌说只有在取消重复页面时才使用这个功能,因为它会把谷歌机器人(和访客)重定向到不同的网址。对于因 HTTP 和 HTTPS 页面同时可访问而导致内容重复,这对此尤为有用。

延伸阅读

  • 301 重定向解析:它们如何影响 SEO(搜索引擎优化)

HTTP 头部中的 rel=“canonical”

对于像 PDF 这样的文档,没有页面标题的规范标签,因为没有页面<head>部分。在这种情况下,你需要使用 HTTP 头部来设置规范。

以下是这篇博客文章 PDF 版本的样子:

HTTP/1.1 200 OKContent-Type: application/pdfLink: <https://ahrefs.com/blog/canonical-tags/>; rel="canonical"

你也可以在标准网页的 HTTP 头中使用规范。

网站地图

网站地图中应只列出规范 URL,尽管谷歌表示这样做是弱规范化信号 。

顺便说一句。正如约翰·穆勒在本视频中提到的,内部和外部的联系也是另一种规范化信号。


常见的正典化错误与最佳实践

规范化可能很复杂。因此,关于如何正确正典化存在许多误解和误解。

错误#1:通过 robots.txt 屏蔽了规范化的 URL。

在 robots.txt 中屏蔽 URL 会阻止谷歌爬取该 URL,这意味着它无法看到该页面上的任何规范标签。这反过来防止了它将任何“链接权益”从非规范转移到规范资产。

错误 #2:将规范化的 URL 设置为 noindex(无索引)

千万不要把 noindex 和 rel=canonical 混在一起。它们是矛盾的指令。

John Mueller 在 Reddit 上表示 ,Google 通常会优先使用规范标签而非 noindex 标签,但这并非保证。谷歌官方文档说 noindex 会完全将该页面从搜索中移除。这可能是期望的最终结果,但其他规范化方法应能达到同样效果,而不会带来潜在的负面影响(例如,谷歌无法整合“链接权益”)。

错误 #3:为规范化的 URL 设置 4XX HTTP 状态码

为正规化的 URL 设置 4XX HTTP 状态码的效果与使用 noindex 标签相同:Google 将无法看到正规标签,因此无法将“链接权益”转移到正规版本。

错误 #4:将所有分页页面规范化为根页面

谷歌说不要将分页页面归入系列的第一页。

顺便说一句。你还应该用 rel=prev/next 标签来分页。这些工具现在谷歌已经不再使用了,但必应仍然使用。

错误#5:没有使用带有 hreflang 的规范标签

Hreflang 标签用于指定网页的语言和地理定位。

谷歌表示 ,使用 hreflang 时应“指定同一语言的规范页面,或者如果同一语言没有规范语言,则指定最佳替代语言。”

错误 #6:拥有多个 rel=canonical 标签

拥有多个 rel=canonical 标签会导致 Google 忽略它们。在许多情况下,这是因为标签在系统的不同节点入,比如由 CMS、主题和插件插入。这也是为什么许多插件都有覆盖选项,以确保它们是规范标签的唯一来源。

另一个可能存在问题的地方是 JavaScript 添加的规范数据。如果你在 HTML 回复中没有指定规范 URL,然后用 JavaScript 添加 rel=canonical 标签,那么 Google 渲染页面时应该会被尊重。然而,如果你用 HTML 指定了一个规范版本,却用 JavaScript 替换了首选版本,那你就在给谷歌传递矛盾信号。

错误#7:Rel=典<body>范

Rel=规范的应仅出现在<head>文档的 中。页面部分的规范标签<body>将被忽略。

这可能成为问题的地方在于文档的解析。虽然页面的源代码中 rel=canonical 标签可能位于正确位置,但当页面实际在浏览器中构建或由搜索引擎渲染时,许多因素如未关闭标签、注入 JavaScript 或<iframes>在<head>该分段中,可能导致渲染<head>时提前结束。在这种情况下,规范标签可能会意外被丢弃在<body>渲染页面中,导致无法被尊重。


如何查找并修复你网站上的规范标签问题

规范化很容易出错,因此定期审核网站以防规范标签相关问题并尽快修复是明智的。

你可以使用 Ahrefs 的 Site Audit,使用 Ahrefs 网站管理员工具(AWT) 账户,免费使用经过认证的网站。它会爬取你的网站,涵盖 170 多个 SEO 问题,包括与规范标签相关的问题。

以下是 Site Audit 可能发现的 14 个典型问题及其修复方法:

1. 4XX 年的正典要点

一个或多个页面被规范化为死(4XX)URL。

为什么这是个问题

搜索引擎不收录 4XX 页面,因为它们根本无法使用。因此,他们会忽略指向这些页面的任何规范标签,常常最终索引错误的(非规范)版本。

如何修复

检查受影响的页面,将失效的(4XX)规范链接替换为你希望索引的 200 个正常页面链接。

2. 5XX 年的正典节点

有一个或更多页面被规范化为 5XX 网址。

为什么这是个问题

5XX HTTP 状态码表示服务器问题,导致无法访问的规范页面。谷歌不太可能索引不可访问的页面,因此可能会忽略规范。

如何修复

将任何错误的规范 URL 替换为有效的 URL。如果指定的规范正确,检查服务器配置是否错误。请注意,如果爬行发生在站点维护中断或服务器过载时,这可能是暂时的问题。

3. 用于重定向的典范点

一个或多个页面被规范化为重定向 URL。

为什么这是个问题

规范索引应始终指向最权威的页面版本。重定向 URL 则不适用。因此,搜索引擎可能会误解或忽视规范。

如何修复

用指向最权威版本的页面(即返回 200 HTTP 状态码且不重定向的版本)替换规范链接。

4. 规范 URL 无外部链接

一个或多个指定的规范 URL 没有内部链接。

为什么这是个问题

没有内部链接的规范 URL 对网站访问者是无法访问的。在网站上,他们被引导到非正统版本的页面。

如何修复

将任何内部链接替换为直接指向规范页面的链接。

5. 规范 URL 无外部链接

没有指向一个或多个声明的规范 URL 的内部链接。

为什么这是个问题

因为浏览你网站的人无法访问官方的 URL。内部链接也是谷歌的规范化信号。

如何修复

检查你的网站导航和链接架构,确保所有规范页面都易于访问。你应该尽可能直接内部链接到规范的 URL。

6. 无正典的重复页面

存在一个或多个重复或非常相似的页面,但没有指定规范版本。

为什么这是个问题

由于没有指定规范版本,谷歌将尝试自行识别最合适的版本以显示在搜索结果中。这可能不是你想要被索引的版本。

如何修复

检查重复的分组。选择一个应被索引在搜索结果中的规范版本。将此定义为所有重复的典范版本(并在典范版本中添加自引用典范标签)。

7. Hreflang 到非正典

一个或多个页面在其 hreflang 注释中指定非规范的 URL。

为什么这是个问题

hreflang 标签中的链接应始终指向规范页面。从 hreflang 注释链接到非规范版本的页面可能会让搜索引擎感到困惑和误导。

如何修复

将受影响页面的 hreflang 注释中的链接替换为其规范链接。

8. 网站地图中的非正典页面

网站地图中列出了一个或多个非正典页面。

为什么这是个问题

谷歌表示,你不应该在网站地图中包含非规范的 URL。原因是他们把网站地图中的页面视为推荐的规范页面。你应该只列出你希望在网站地图中被索引的页面。

如何修复

从你的网站地图中移除非规范的 URL。

9. 非规范页面被指定为规范页面

一个或多个页面指定了一个规范的 URL,该 URL 也会被规范化到不同的页面。这形成了一个“规范链”,即 A 页被规范化到 B 页,B 页再规范化到 C 页。


为什么这可能是个问题

规范链可能会混淆并误导搜索引擎。因此,他们可能会误解或忽视指定的典范。

如何修复

将受影响页面规范标签中的非规范链接替换为直接指向规范链接。例如,如果页面 A 被规范化到页面 B,而页面 B 又规范化到页面 C,则将页面 A 上的规范链接替换为指向页面 C 的链接。

10. 开放图 URL 不匹配典范

og:url Open Graph 标签和 rel=canonical 标签中指定的 URL 不匹配。

为什么这可能是个问题

这对谷歌 SEO 来说不是问题,但非官方版本的页面会在社交网络上被分享。

如何修复

确保 og:url 中指定的 URL 与规范页面的 URL 一致。

11. 从 HTTPS 到 HTTP 的规范化

一个或多个安全(HTTPS)页面指定一个非安全(HTTP)版本作为规范版本。

为什么值得修复

HTTPS 是排名因素 ,因此尽可能将安全版本的页面指定为规范是合理的。

如何修复

将 HTTP 页面重定向到 HTTPS 对应的页面。如果不行,可以从 HTTP 版本页面添加一个 rel=“canonical”链接到 HTTPS 版本。

顺便说一句。谷歌还将实施 HSTS 列为潜在解决方案。

12. 从 HTTP 到 HTTPS 的规范

一个或多个非安全(HTTP)页面指定安全(HTTPS)版本作为规范版本。

为什么值得修复

HTTPS 优先于 HTTP。有一个页面的 HTTP 版本,然后又指定 HTTPS 版本为规范,是不合逻辑的。这可能不会造成大问题,但如果可能的话还是值得修复。

如何修复

实现一个从 HTTP 到 HTTPS 的 301 重定向。你还应该把任何指向 HTTPS 版本的内部链接替换为直接指向 HTTPS 版本的链接。

13. 规范网址更改

自上次爬取以来,一个或多个被宣布为规范的 URL 发生了变化。

为什么值得修复

这可能说明自上次爬取以来出现了错误或问题。记住,声明的规范页面应该是你希望谷歌索引和排名的版本。

如何修复

请查看受影响页面,确保这些更改是有意为之。

14. 非规范页面获得自然流量

一个或多个非正规页面会出现在搜索结果中并获得自然搜索流量(这本不该发生)。

为什么值得修复

要么是你的规范标签设置错误,要么谷歌选择忽略了指定的规范标签。

如何修复

检查所有报告页面的 rel=canonical 标签是否正确设置。如果不是这个问题,可以使用谷歌搜索控制台的 URL 检查工具,看看他们是否将指定的规范 URL 视为规范。如果存在不匹配,请调查原因。



本文内容仅供参考,不构成任何专业建议。使用本文提供的信息时,请自行判断并承担相应风险。

分享文章
合作伙伴

本站所有广告均是第三方投放,详情请查询本站用户协议