規範化和重複內容

已發表: 2023-05-13

Canonicalization and Duplicate Content | A Full Of Colorful Jewels

大多數人都有多個版本的 URL,這些 URL 指向不同但相似的網站版本。 這有幾個原因。 首先,網站所有者可能會拆分測試不同的元素或跟踪來自其他地方(如社交媒體網站)的流量。

由此產生了幾個問題。 首先,哪些網站版本被編入索引並成為谷歌在其結果頁面上顯示供搜索者查看的版本? 在確定哪個版本是在 SERP 上排名的主要版本或“規範”版本時,谷歌會看什麼? 網站所有者會因為擁有這些重複的內容頁面而受到懲罰嗎?

這個過程叫做規範化、規範化或標準化,今天我們就為大家解答這些問題,給大家一個更準確的規範化概念。 我們將深入探討基礎知識、Google 關注的信號,並查看使用多個站點版本和重複內容的示例場景。 這只是基本信息,因此如果您需要更多信息或規範化問題方面的幫助,請諮詢白標 SEO 服務。

讓我們跳進去吧!

尋找白標 SEO 專家? 立即聯繫我們!

規範標籤

The Canonical Tag | An Arrow Pointing To A WebsIte 規範標籤是您可以輸入到頁面代碼或 HTTP 標頭的“<head>”部分的代碼。 這會通知搜索引擎,您的 URL 版本是您要對其進行排名的版本 - 谷歌向搜索者顯示的版本。 當搜索引擎抓取網站並遇到重複或相似的內容(包括這些標籤)時,它會澄清一個 URL 版本是您希望編入索引的版本。

這是它的樣子:

<link rel=”canonical” https://www.yourwebsitehere.com />

(確保代碼正確輸入和關閉。)

然而,值得注意的是,這只是谷歌檢查的其他信號之一。 谷歌會考慮幾個因素,甚至可能會忽略規範標籤以支持不同的信號。

規範化信號

那麼 Google 如何確定哪個 URL 是“規範”版本呢?

Google 的 John Mueller 解釋說,在選擇規範 URL 時有兩個一般準則:

  1. 網站偏好——網站告訴谷歌它希望規範 URL 是什麼
  2. 用戶偏好——Google 確定的 URL 對搜索者更有利

Google 會查看有關網站偏好的內容:

  • 規範標籤(鏈接 rel 規範)
  • 站點地圖文件中的 URL
  • 內部鏈接
  • 重定向
  • HTTPS 網址
  • 看起來更好/更乾淨的 URL

Mueller 說他們考慮了所有這些元素,並根據哪個 URL 最好地結合了這些元素來選擇規範的元素。 他還建議網站所有者,如果他們更喜歡向搜索者顯示哪些 URL,他們必須在他們的網站上一致地應用這些偏好。 同樣,如果您在這方面的資源有限,白標本地 SEO 會很有幫助。

規範化過程中的其他因素包括重複、外部鏈接和 Hreflang。

谷歌會考慮幾個因素,甚至可能會忽略規範標籤以支持不同的信號。 點擊鳴叫

重複內容

Duplicate Content | A Laptop That Has An Image Of A Spaceship 重複或非常相似的內容可能出於各種原因(有意或無意)而存在,並且可能在排名時導致許多問題。 規範化可以緩解這些問題。 雖然重複內容本身不會給你帶來懲罰,但這並不意味著它完全沒有後果。

主要是,重複的內容可能會延遲正確的網站頁面顯示在結果頁面上。 例如,如果您有兩個相似的頁面針對確切的關鍵字進行排名,它們可能會競爭,否則 Google 將花費時間來確定將哪一個放在 SERP 上。 即使谷歌找到它,它也可能不會顯示你喜歡的版本或你付出更多努力的版本。 谷歌在識別哪些頁面提供最佳用戶體驗方面做得越來越好。 儘管如此,有價值的內容有時會像一堆牙籤中的一根針一樣被過多的重複所掩蓋——形式相似但本質不同。 您可以通過規範化實踐來簡化此過程。

Google 的重複規範化規則

在 URL 方面,Google 通常會選擇更簡潔、更短的 URL 版本,而不是更長且包含參數的 URL 版本。 此外,與站點的 HTTP 版本相比,Google 通常更喜歡 HTTPS。

當 Google 在頁面上遇到重複內容時,它會選擇規範版本進行索引。 這將是它確定為最佳的版本。 它識別為重複的所有頁面將形成一個頁面集群。 信號被發送到該集群內的頁面,並充當指向所選規範的整合器。 請注意,Google 確定的規範仍會隨著時間的推移而變化,具體取決於 Google 排名和索引因素。

以下是一些被認為是頁面上的重複內容甚至規範化問題的案例示例:

  • 帶有“www”的 URL。 與那些沒有
  • 有帶或不帶大寫字母的 URL – 建議盡可能使用小寫字母。
  • 網址末尾有和沒有尾部斜杠“/”的 URL
  • 包含抓取或聯合內容的頁面的 URL——抓取是非法的,但如果您鏈接到原始所有者,則允許內容聯合。 如果 Google 選擇您的 URL 作為原始站點的規範版本,聯合會成為一個問題。 這是更高程度的內容盜竊,如果發生這種情況,必須加以解決。
  • 帶有和不帶有“index.html”的 URL。
  • 包含相同內容的 URL 位置變體
  • 移動設備的 URL
  • 從社交媒體網站重定向的 URL 版本
  • URL 參數,無論是否改變頁面內容,都添加在 URL 的末尾,例如分面導航、跟踪代碼、會話 ID、排序內容等。
  • 任何顯示與另一個頁面相同的完整內容的頁面都會讓 Google 感到困惑,並導致選擇錯誤的規範,包括博客的主頁、類別頁面、標籤頁面、分頁頁面或提要頁面。

請記住,在網站偏好方面,一致性至關重要。 盡可能統一地構建您的 URL,以盡量減少重複內容和規範化問題。

詳細了解規範化和重複內容! 現在就打電話給我們!

Hreflang

Rules | A Chalkboard With Letters In It 雖然 Hreflang 可以解決某些網站上的重複問題,但它不適用於國際網站。 默認情況下,Google 會選擇正確的網站版本並嘗試切換到本地版本。 但是,它並不總是有效,因為本地版本不是主要站點,可能會導致問題。 如果是這樣,那麼用戶最終會看到為不同國家/地區的用戶提供的網站頁面。 因為谷歌的系統沒有設置正確地解決這個問題,所以鼓勵網站所有者發布多語言頁面,例如,內容至少略有不同(即使內容是簡單的翻譯)。

對於 JavaScript 網站,通常是那些構建在應用程序外殼模型上的網站,首先出現在頁面上的代碼可以與其他頁面甚至不同網站上的代碼閱讀起來非常相似。 因此,頁面有時會被規範化為其他頁面集群(即其他網站)的一部分或同一域級別的其他頁面。

請記住,Google 使用算法並且很可能會自動循環運行重複檢測。 這可能是問題的一部分。 如果 Google 在看到代碼時將頁面標記為重複但沒有完全抓取它們,則可能無法正確交換它們,因為它看起來像是基於 HTML 內容的另一個頁面。 這意味著呈現頁面會出現延遲,因為它已被標記為重複。 作為您的白標專家,我們可以提供白標數字廣告和 SEO 服務方面的幫助。