XML 站点地图:您需要了解的 SEO 的一切

已发表: 2019-01-25

你最后一次使用地图是什么时候?

我什至不记得说实话。

但是站点地图——站点地图在 SEO 方面与以往一样重要。

多年来,我只是将站点地图提交到 Google Search Console,因为我听说这是最佳实践,然后选中此框并继续前进。

我不完全理解我为什么这样做,并且充满了误解。

但是 XML 站点地图不仅仅是一个需要检查的框。

站点地图是一个强大的工具,作为 SEO,了解他们的背景、来龙去脉和最佳实践至关重要。

XML 站点地图:您需要了解的 SEO 的一切

什么是 XML 站点地图?

简而言之,XML 站点地图是包含网站最重要页面的目录或指南。 它们旨在帮助爬虫了解您的网站及其结构。

站点地图是一种 XML(可扩展标记语言)文件,很容易被搜索引擎消化。 它看起来像这样:

这只是一个 URL,并根据 sitemaps.org 展示所有可用标签,但唯一需要的标签是位置 - 页面的 URL。

Yoast 是一种流行的 WordPress 网站 SEO 工具,它生成的站点地图如下所示:

如前所述,站点地图的主要功能是帮助搜索引擎了解网站。 XML 站点地图通过指示三个重要的事情来做到这一点:

  1. 网站上最重要的页面。
  2. 网站结构和架构。
  3. 最近页面的更新时间。

2 关于 XML 站点地图的常见误解

在我们深入探讨如何生成站点地图、包含哪些内容和排除哪些内容之前,让我们先解决两个非常常见的误解。

1. 每一页都应该包含在内

如上所述,站点地图应展示网站最重要的页面。 理论上,只有您希望在搜索引擎上找到的网站页面才应包含在您的站点地图中。

如果可能,您应该尽最大努力将您的网站页面分为两类:您希望用户从搜索引擎登陆的页面和不希望用户登陆的页面。

您希望从搜索引擎访问的页面不应被 robots.txt 阻止,并且包含在您的 XML 站点地图中。

您不想被搜索引擎访问的页面被 robots.txt 阻止,并且不应包含在您的 XML 站点地图中。

2. 包含的每一页都会被索引

你没看错:

仅仅因为您在站点地图中包含了一个 URL 并不能保证它被编入索引。

反之亦然,即使您在站点地图中排除了某个 URL,搜索引擎爬虫仍可能将该页面编入索引。

XML 站点地图只是对爬虫的建议。 请务必记住,您的网站正在向抓取工具发送许多其他信号。 如果您真的不希望将页面编入索引,我们绝对会推荐 robots.txt 禁止。

要查看 Google 确实在索引哪些页面,最有效和最真实的方法可能是执行站点:搜索。

您还可以执行对特定 URL 的搜索,以查看它是否可能被编入索引。

XML 站点地图最佳实践

因此,我们对 XML 站点地图是什么有了一个很好的了解,并且我们研究了一些常见的站点地图误解。 让我们深入探讨最佳实践。

1. 使用工具生成站点地图

正确使用站点地图的第一步是生成一个。 不幸的是,它们不仅仅是神奇地创造出来的。 你有几个选项可以这样做:

Yoast 搜索引擎优化

如果您的网站是在 WordPress 上构建的,那么这很容易。 Yoast 提供了一个免费插件来帮助您进行页面优化、索引、规范和站点地图生成。

如果您的网站上尚未安装 Yoast SEO 插件,请执行以下操作:

A.在您的 WordPress 管理仪表板中,导航到插件并单击“添加新的”。

B.在搜索栏中,搜索“Yoast”。

C.单击“立即安装”,然后单击“激活”。

D.导航到 [your-domain.com]/sitemap.xml。

xml-sitemaps.com

这是另一个生成 XML 站点地图的好工具,尤其是在您不使用 WordPress 的情况下。 这是做什么:

A.导航到 xml-sitemaps.com 并在输入栏中输入您的域。

B.允许网站抓取您的域(可能需要一分钟左右)。 下载您的站点地图。

C.使用 FTP 或文件管理器,将域上传到您网站的根文件夹。

如果您有一台 Windows 计算机,我们推荐 Filezilla。 以下是使用 Filezilla 上传文件的一些说明。 如果您有 Mac 计算机,我们建议您使用 Transmit。 以下是使用 Transmit 的一些说明。

2.提交到谷歌搜索控制台

现在您有了站点地图,您可能想知道如何处理它。

第一步是将其提交到 Google Search Console。 这将有助于 Google 抓取您的网站并将其编入索引,但正如我们所提到的,这并不能保证包含的每个页面都会被编入索引,或者被排除的每个页面都将从索引中排除。

这是做什么:

A.导航到 Google Search Console 并选择“立即开始”。 如果您已有 G Suite 帐户,请在此处登录。 如果没有,这里有一个设置指南。

登录后,您应该会看到如下所示的屏幕:

B.输入您的域并单击“添加属性”。

Google 需要验证您确实拥有该网站。 如果您设置了 Google Analytics,它会自动为您完成。 如果没有,还有其他一些验证选项。

C.导航到站点地图。

D.插入您的站点地图 URL,然后单击“提交”。

你都准备好了! 给 Google 一些时间来阅读站点地图并定期检查 Google 是否遇到任何错误。

3.优先考虑最高质量的页面

在排名方面,谷歌似乎不仅考虑了相关页面的价值,还考虑了网站的整体质量。

假设您的网站有 500 个页面,但只有 10 个页面包含对用户有用的精彩内容。 其余的要么是旧的和不相关的博客文章,要么是“实用”页面(登录、购物车、找回丢失密码的地方等)。

谷歌很可能会将此作为一个信号,表明您网站的绝大多数内容都包含低质量的内容,从而损害了您对最重要的网页进行良好排名的机会。

因此,当您决定要在站点地图中包含哪些页面时,请记住这一点。 正如我们上面提到的,它非常简单:

  • 包括并索引您希望通过搜索引擎找到的页面
  • 排除您不想通过搜索引擎找到的无索引页面

4.使用无索引

说到包含和排除页面,保持一致非常重要。 在您的站点地图上包含一个页面但指示搜索引擎不要抓取它不是一个好主意。

因此,如果您不希望站点地图中包含某个页面,请将其关闭,并确保它没有被索引。

在确保搜索引擎不会抓取您的网站时,您有几个选择。 您可以使用元机器人(页面 <head> 中的说明)或 robots.txt 文件(包含爬虫说明的单个文件)。

对于较旧的博客文章或实用程序页面,元机器人可能是一个安全的选择,而如果您希望最大限度地减少抓取预算,则 robots.txt 禁止会更有意义。

5.考虑抓取预算

说到您的抓取预算,在考虑在 XML 站点地图中包含或排除哪些页面时,请务必牢记这一点。

简而言之,抓取预算与 Google 所说的“抓取速度限制”有关。 换句话说,Googlebots 不能只在他们想要的任何时候抓取网络上的每一个页面。 Google 的服务器和您网站的服务器都有限制。

如果您有一个非常大的网站(我们说的是几千个 URL),那么在选择要包含的页面时,您必须比网络上大多数页面少得多的网站更加小心。

直接从 Google 了解有关抓取预算和最佳做法的更多信息。

到此为止,您需要了解有关 XML 站点地图、如何生成、提交和使用它们来提升您的 SEO 的所有信息。

完成所有这些步骤后,请确保您使用Monitor Backlinks密切关注您的网站性能。 它会为您跟踪您的关键字,以便您始终知道您的哪些网页被抓取并在 Google 上排名。

您可以在此处获取 30 天的免费试用版,试一试。

现在去帮助 Google 更好地抓取您的网站!