什么是规范标签以及何时使用它们

已发表: 2022-11-03

规范标签,通常称为 rel=“canonical”,是一个 HTML 标签,它告诉搜索引擎哪个 URL 是内容的主要版本或“主副本”。 这些简单的标签使网站所有者能够建议一个 URL 供 Google 指定为出现在搜索中的首选页面。 规范标签还可以防止重复内容引起的 SEO 问题。

这些简单的 HTML 链接元素在您网站的 SEO 中发挥着重要作用。 它们也很容易使用,但只有在正确使用时才能工作。 如果您不熟悉规范标签,本文将帮助您了解如何、何时以及为何使用规范标签,以及如何避免规范标签问题。

什么是规范标签?

规范标签如何与指向主版本的重复版本一起工作

规范标签是插入页面标题或 <head> 的 HTML 链接元素。 这些标签由搜索引擎开发并于 2009 年推出。它们是搜索引擎与网站所有者合作以提高搜索结果质量的优秀示例之一。

规范标签告诉搜索引擎以下内容之一:

  1. 除了应将哪些页面视为主要版本之外,页面上的该内容是另一个页面的副本。
  2. 对于具有多个 URL 的单个页面,该标记会告诉 Googlebots 或 Bing bot 哪个确切的 URL 是正确的要编入索引的 URL。

这个标签告诉爬虫索引主页面而不是重复页面。 规范 URL 向 Google 指示搜索引擎应该在搜索引擎结果中显示哪个页面,该标签告诉搜索引擎主要版本是应该接收自然搜索可见性的页面。

请记住,虽然您可以告诉 Google 将哪个网址编入索引,但Google 可能不会遵循您的建议

规范标签如下所示:

规范标签示例

或者

<link rel= "canonical" href= " https://example.com " />

规范标签的组成部分是什么?

规范标签的所有部分的细分

规范标签也称为规范链接元素——对于这个独特的 HTML 代码来说,这是一个更直观的标签。 为什么? 因为规范标签提供规范链接并定义页面和链接之间的关系。

在 HTML 中, rel告诉 Googlebot 页面和链接资源之间存在关系。 在这种情况下,关系标识出现在href属性之后的规范页面(href 是超文本引用)。

什么是规范 URL

规范 URL 是网站所有者希望搜索引擎将其识别为内容的主要来源的网页的主要版本。 规范 URL 是您希望网络爬虫索引为正确内容来源的网页。 这部分链接元素出现在 href=”canonicalURL” 之后。

规范标签是否与规范 URL 相同?

规范标签与规范 URL

规范 URL 出现在规范标记内。 规范 URL 是规范标记内的超链接引用元素。 这表示应该被视为源内容的规范版本的确切 URL。

为什么规范化很重要?

对于电子商务网站和产生广告收入的网站,您要确保抓住每一个机会在搜索引擎结果页面 (SERP) 中提供最佳 URL。 而规范化就是通过告诉 Google 哪个站点应该被索引来做到这一点的。 您不仅可以更好地控制您的网站,还可以将用户引导到价值最高的页面。

你应该使用自引用的规范标签吗?

即使是看似独特的网页,也可以在各种 URL 下找到。 例如:

显示 url 变体的图表作为规范标签如何工作的示例

虽然这些 URL 中的每一个都将显示相同的主页,但从技术上讲,每个 URL 也是它自己的 URL。 这可能会导致与第三方网站上的重复内容相同的问题。 如果在 linkgraph.io 上没有规范标签,搜索引擎算法将不会显示给搜索者的首选 URL。

让搜索引擎更加困惑的是,动态页面通常有各种各样的标签,每个标签都有自己的 URL。 像 WordPress 这样的内容管理系统 (CMS) 通常也会自动将标签嵌入到网页中。 因此,即使是一个基本页面也会包含大量 URL——每个 URL 都可以完美地被搜索引擎索引。

因此,最好的办法是在规范 URL 的标头中也放置一个规范标签。

规范标签简化数据收集和分析

此外,当您跟踪搜索指标时,您希望为同一 URL 下的一个页面编译所有自然搜索。 您的规范标签确保只有指定的页面会收到搜索结果指标。

防止与联合内容的 SEO 冲突

许多网站通过内容联合建立反向链接。 但是,创建内容可能是一项及时且昂贵的投资。 通过联合关系,您可以在第三方网站上向用户提供您现有的高质量内容。 或者继续在您的网站上构建您的内容库,同时扩大您的品牌知名度。

但是,如果没有规范标签,搜索引擎将不知道是为文章还是第三方索引您的网站。 规范标签允许您和您的联合合作伙伴简化此问题。 注意:您也可以在其中一个页面上使用 noindex 标签来防止重复。

重复内容有什么问题?

重复的内容可能会导致与 SEO 相关的各种问题。 当 Googlebots 索引具有相同或非常相似内容的网页时,它可以:

  • 减慢索引过程,从而减少您的网站被索引。
  • 注册为返回给 Google 的负面排名信号,导致您的页面在 SERP 中排名更靠后。
  • 混淆搜索引擎应该向搜索者显示哪个页面。

规范标签如何帮助 SEO

首先,规范标签是影响 Google 如何向搜索者展示您的网站的少数几种方式之一。 规范化还可以防止您因重复内容而被“停靠”在 PageRank 中——尽管Google 不会直接惩罚重复内容,但他们会优先考虑组织良好的原始内容,

最后,它们还允许您为网站以外的用户提供出色的反向链接和品牌建设内容。

什么是重复内容?

什么算作重复内容

重复的内容不仅仅是复制和粘贴的文本。 它可以是完全相同、相似或重新排序的书面文本、图像和其他媒体。 如果 CMS 重复内容发布到网络上,Google 还会考虑占位符文本和图像。

您网站上每个页面上的基本信息(例如版权文本)甚至可以被标记为重复。

如何使用规范标签

最终,为了获得最佳 SEO 结果,您将希望在整个网站中使用规范标签。 更新现有页面后,您将希望继续实施规范化最佳实践。

第一步是确定您的网站页面的哪个 URL 版本应该是规范 URL。 如果您的规范链接在格式上是一致的,Google 会更喜欢。 所以,如果你使用“www”。 在您主页的规范链接中,将其包含在您的其他规范 URL 中。

例如,在 LinkGraph,我们在所有规范标签中都使用“https”协议,但不包括“www”。

规范标签示例

这将解决多个 URL 指向同一页面的任何问题。

接下来,您将要标记或消除您网站中的任何重复内容。 您可以使用 SearchAtlas 的站点审核工具来执行此操作。 就像查看您的内容/重复报告一样简单。

重复内容报告

最后,您将希望在第三方网站上找到任何剩余的重复内容。 您可以使用 Copyscape 等工具来执行此操作。 一旦您确定了网络上其他地方的内容,您将要决定是否

  1. 您的内容在未经许可的情况下被盗并重新发布
  2. 您不小心抄袭了预先存在的内容或与其他页面过于相似的书面内容
  3. 联合页面正在注册为重复页面
  4. 您的页面具有相同的内容,但它是合适的,例如出现在两个不同类别页面上的产品

然后,您将需要使用相应的解决方案进行响应:

  1. 向 Google 报告重复项
  2. 立即删除内容并制作原创的高质量内容
  3. 与您的联合合作伙伴讨论哪个页面应该是规范 URL,然后实施反映正确规范的规范标记
  4. 使用带有指定规范 URL 的规范标签

何时使用规范标签

对于规范标签,您可以通过始终使用规范标签来减少重复内容问题。 但是,如果您要更新您的网站,则需要优先考虑:

  • 具有变体过滤的产品类别页面:这包括不同的尺寸、品牌、颜色和数量。 这些变体中的每一个都需要不同的 URL。
  • 使用分页的文章和页面:通常这些是被分成多个页面的长博客。
  • 出现在多个类别页面上的产品页面。
  • 具有类似内容的页面,例如有关您的业务的信息。

在您的网站上实施规范标签

您必须是网站管理员才能实施规范标签吗? 不必要。 如果您对处理网站的 HTML 代码感到满意,则可以自行实施规范标签。

以下是设置规范标签的方法:

HTTP 标头中的规范标签

使用规范标签的最简单方法是在 HTTP 标头中插入和更新标签文本。 您页面的此 HTTP 标头部分如下所示标题标签

1. 确定您首选的规范 URL。

2. 将 rel=canonical 链接标签添加到非规范页面的 <head> 部分,并在 HTML 链接标签中插入正确的规范 URL 链接。

它应该如下所示:

规范标签的示例文本设置

复制粘贴版本:

<link rel= "canonical" href= "https://yoursite/canonicalpage" />

这里的所有都是它的。 无需网站管理员即可链接到页面的规范版本。

验证您的规范标签

要检查您是否使用正确的 URL 正确实施了规范标签,您需要查看网页的源代码。 这个过程很容易。

  1. 首先,使用浏览器导航到要检查的网页版本或内容。
  2. 然后,右键单击页面中的任意位置并选择检查。 这将为您的站点或任何其他站点打开页面(或 URL 检查工具)的源代码,以查看其他人的规范链接元素。 HTML 检查工具
  3. 打开 HTML 源代码菜单后,按 Ctrl + f(Windows)或 f + command(Mac)。 然后在按字符串、选择器或 XPath 的查找中键入“canonical”。 在 html 中查找规范标签
  4. “规范”一词将出现并突出显示黄色,使标题易于查看以进行验证。 检查规范化的 URL 是否正确。 如果未出现任何结果,则该页面没有规范的 HTML 标记。

其他验证规范标签的方法

Google Search Console 和 GSC Insights 是查找被错误标记的页面的绝佳工具。 当您查看自然流量统计数据并注意到到达非规范页面的搜索流量时,您的规范标签可能不正确。

要修复这些页面,您需要导航到特定 URL,然后检查该页面。

站点地图中的规范 URL

创建或更新站点地图时,请勿包含重复的 URL。 您只需要包含您的规范 URL。 您的站点地图包含页面的规范版本将提示 Google 的机器人不要抓取内容的重复版本。

您应该在 Robots.txt 文件中排除重复页面吗?

您不应在robots.txt文件中禁止重复页面。 这将阻止 Google 使用这些页面的排名信号。 当您正确实施规范标签时,排名信号(例如参与度(点击、滚动、文本输入)和内容信号)将计入规范页面的指标。

如何在您的 CMS 中使用规范标签

如果您通过 CMS 平台(例如 WordPress、Shopify、Wix 或 BigCommerce)编辑您的网站。 大多数这些 CMS 都会有添加规范链接标签的特定说明,而无需直接编辑您的 HTML 文档。 我们将介绍最常见的 CMS 平台。

在 Wix、Shopify 或 WordPress 网站中将 Yoast 用于规范标签

使用适用于 WordPress、Shopify 或 Wix 的Yoast SEO 插件,您可以轻松编辑首选 URL 并将其添加为规范标签。

  1. 添加 Yoast SEO 插件后,您会在 Yoast 编辑底部找到高级菜单。 打开这个菜单。 规范标签如何在 yoast 中
  2. 输入要指定为规范 URL 的 URL 版本。 如何通过 yoast 将规范标签添加到 wordpress 页面

不要犯这 8 个规范标签错误

规范标签只有在正确实施的情况下才能正常工作——而错误的实施可能是一场灾难。 幸运的是,您可以避免一些常见错误,以确保您的电子商务网站或广告收入网站充分利用您的下一次 Google 抓取。

如果您注意到您收到的自然流量来自页面的非首选版本,您将需要检查以下问题:

1. 不要使用 301 重定向而不是规范链接

301 不等于规范标签

谷歌和其他搜索引擎创建了规范属性来改进网站的组织和改善用户体验。 当您使用 301 重定向时,您将增加页面加载时间。 这是因为服务器必须在检索页面的其他版本之前检索重定向的 URL。

此外,当您选择重定向而不是规范属性时,您向 Googlebots 发送了错误的信号。

2.内部链接和规范标签

不要选择没有任何内部链接的页面作为您的规范版本。 规范标签只是对爬虫的提示,如果您的规范 URL 未出现在站点地图中,则很有可能不会将其编入索引。

3. 在任何重复页面上使用“noindex”

无需阻止 Googlebot 将您的重复页面编入索引。 事实上,您希望您的重复页面将其链接资产和其他质量信号传递到您的规范页面。

Noindex应保留用于封闭内容和您希望从搜索结果中隐藏的其他内容。

4. 防止规范化 URL 出现 4XX 状态码

404错误

请务必正确输入您的规范链接的 URL。 如果您不确定要使用哪个版本,请考虑将绝对 URL 设为默认值。

绝对 URL 应包括协议 (HTTPS)、域名 ( www.yourhomepage.com ) 和任何子文件夹 (/subfolder)。 请记住,您希望使用 HTTPS 协议来证明您的站点对您的用户具有 SSL 安全性。

并始终检查您的首选 URL 是否拼写正确。 这是 404 错误的最常见原因。

5.将所有分页页面规范化到根页面

分页内容的解释和示例

在创建具有多个网页的博客文章或指南时,不要从后续页面规范地链接到系列中的第一页。 这将阻止 Googlebot 将整个系列编入索引。 相反,您需要将 rel=”canonical” 替换为 rel=”prev” 和 rel=”next”。

6. 不使用带有 Hreflang 标签的规范

Hreflaf 标签告诉 Google 一个页面以多种语言显示,以更好地服务于多样化和多区域的受众。 不同的语言版本可以被视为内容重复。 因此,Google 要求网站管理员始终将 Hreflang 标签与规范标签结合使用。

7.在一页上使用多个规范标签

一个经常被忽视的问题是不小心使用了多个 rel=canonical 标签。 当多人编辑一个页面时,可能会出现此问题。 幸运的是,如果您意识到这一点,它很容易修复并且很容易避免。

8. 规范 URL 中的基本错别字

如果您插入了规范标签,但注意到自然流量到达了非首选页面,请仔细检查所有元素是否放置正确。 请注意,最常被跳过的字符之一是斜杠。

拥抱规范标签并享受更好的搜索引擎优化结果

如果您不使用规范标签,您可能会错过。 规范标签可以防止由 URL 变体引起的大量重复内容问题,从而提高 SEO 性能和更有条理的网站供 Google 抓取。 此外,当您实施规范标签时,您的所有搜索指标都将被编译到一个整洁的页面中,而不是无数的变体。

在您的搜索指标上保持领先,并使用可用的最佳关键字跟踪工具充分利用您的合并数据