Kanonisierung und Duplicate Content

Veröffentlicht: 2023-05-13

Canonicalization and Duplicate Content | A Full Of Colorful Jewels

Die meisten Menschen haben mehrere Versionen einer URL, die auf separate, aber ähnliche Versionen ihrer Website verweisen. Dafür gibt es mehrere Gründe. Erstens kann der Websitebesitzer einen Split-Test verschiedener Elemente durchführen oder den Datenverkehr von anderen Orten, beispielsweise von Social-Media-Websites, verfolgen.

Daraus ergeben sich einige Fragen. Erstens: Welche Website-Versionen werden indiziert und werden von Google auf den Ergebnisseiten angezeigt, damit die Suchenden sie sehen können? Worauf achtet Google bei der Bestimmung, welche Version die wichtigste oder „kanonische“ Version ist, die in den SERPs rankt? Werden Websitebesitzer für das Vorhandensein dieser Seiten mit doppeltem Inhalt bestraft?

Dieser Prozess wird als Kanonisierung, Normalisierung oder Standardisierung bezeichnet. Diese Fragen werden wir heute für Sie beantworten und Ihnen einen genaueren Begriff der Kanonisierung geben. Wir werden uns mit den Grundlagen befassen, welche Signale Google berücksichtigt, und uns Beispielszenarien ansehen, in denen mehrere Website-Versionen und doppelte Inhalte verwendet werden. Hierbei handelt es sich nur um wesentliche Informationen. Wenden Sie sich daher bitte an White-Label-SEO-Dienste, wenn Sie weitere Informationen oder Hilfe bei Problemen mit der Kanonisierung benötigen.

Lasst uns einsteigen!

Auf der Suche nach White-Label-SEO-Experten? Kontaktiere uns jetzt!

Das kanonische Tag

The Canonical Tag | An Arrow Pointing To A WebsIte Ein kanonisches Tag ist ein Code, den Sie in den Abschnitt „<head>“ Ihres Seitencodes oder den HTTP-Header eingeben können. Dies informiert Suchmaschinen darüber, dass diese Version Ihrer URL diejenige ist, für die Sie ein Ranking erstellen möchten – die Version, die Google den Suchenden anzeigt. Wenn Suchmaschinen Websites durchsuchen und auf doppelte oder ähnliche Inhalte, einschließlich dieser Tags, stoßen, wird klargestellt, dass eine URL-Version diejenige ist, die Sie lieber indexieren möchten.

So sieht es aus:

<link rel=“canonical“ https://www.yourwebsitehere.com />

(Stellen Sie sicher, dass der Code korrekt eingegeben und geschlossen wird.)

Es ist jedoch anzumerken, dass dies nur eines der anderen von Google überprüften Signale ist. Google berücksichtigt mehrere Faktoren, und das Canonical-Tag kann sogar zugunsten eines anderen Signals übersehen werden.

Kanonisierungssignale

Wie ermittelt Google also, welche URL die „kanonische“ Version ist?

John Mueller von Google erklärt, dass es bei der Auswahl der kanonischen URL zwei allgemeine Richtlinien gibt:

  1. Site-Präferenz – was die Site Google mitteilt, wie die kanonische URL lauten soll
  2. Benutzerpräferenz – welche URL Google ermittelt, ist für den Suchenden vorteilhafter

Was Google in Bezug auf die Website-Präferenz berücksichtigt:

  • Canonical-Tag (Link rel canonical)
  • Welche URL steht in der Sitemap-Datei?
  • Interne Verlinkung
  • Weiterleitungen
  • HTTPS-URLs
  • URLs, die besser/sauberer aussehen

Mueller sagt, dass sie all diese Elemente berücksichtigen und das kanonische auswählen, basierend darauf, welche URL diese Dinge am besten integriert. Er weist Websitebesitzer außerdem darauf hin, dass sie, wenn sie bevorzugen, welche URLs den Suchenden angezeigt werden sollen, diese Präferenzen konsistent auf ihren Websites anwenden müssen. Auch hier ist lokales White-Label-SEO hilfreich, wenn Sie in diesem Bereich nur über begrenzte Ressourcen verfügen.

Weitere Faktoren im Kanonisierungsprozess sind Duplikate, externe Links und Hreflang.

Google berücksichtigt mehrere Faktoren, und das Canonical-Tag kann sogar zugunsten eines anderen Signals übersehen werden. Klicken Sie zum Twittern

Doppelter Inhalt

Duplicate Content | A Laptop That Has An Image Of A Spaceship Doppelte oder sehr ähnliche Inhalte können aus verschiedenen Gründen, absichtlich oder unbeabsichtigt, vorhanden sein und viele Probleme beim Ranking verursachen. Die Kanonisierung kann diese Probleme abmildern. Auch wenn Duplicate Content per se keine Strafe nach sich zieht, heißt das nicht, dass es völlig folgenlos bleibt.

Duplicate Content kann vor allem dazu führen, dass die richtigen Seiten der Website nicht auf den Ergebnisseiten angezeigt werden. Wenn Sie beispielsweise zwei ähnliche Seiten haben, die für die genauen Keywords ranken, könnten diese konkurrieren, oder Google braucht Zeit, um zu bestimmen, welche Seite auf den SERPs platziert werden soll. Selbst wenn Google dazu kommt, wird möglicherweise nicht die Version angezeigt, die Sie bevorzugen oder in die Sie sich mehr Mühe gegeben haben. Google wird immer besser darin, herauszufinden, welche Seiten das beste Nutzererlebnis bieten. Dennoch können wertvolle Inhalte manchmal unter übermäßigen Duplikaten versinken wie eine Nadel in einem Stapel Zahnstocher – ähnlich in der Form, aber nicht im Wesentlichen. Sie können diesen Prozess durch Kanonisierungspraktiken vereinfachen.

Googles Regeln zur doppelten Kanonisierung

In Bezug auf URLs wählt Google häufig eine übersichtlichere, kürzere URL-Version gegenüber einer längeren URL-Version mit Parametern. Außerdem bevorzugt Google häufig HTTPS gegenüber der HTTP-Version einer Website.

Wenn Google auf einer Seite auf doppelten Inhalt stößt, wählt es eine kanonische Version zur Indexierung aus. Dies wird die Version sein, die als die beste ermittelt wird. Alle Seiten, die als Duplikate identifiziert werden, bilden einen Seitencluster. Signale werden an die Seiten innerhalb dieses Clusters gesendet und fungieren als Konsolidierer, der auf die ausgewählte Kanonik verweist. Beachten Sie, dass sich die von Google ermittelte Kanonizität im Laufe der Zeit je nach Google-Ranking und Indexierungsfaktoren ändern kann.

Im Folgenden finden Sie einige Beispiele für Fälle, die als doppelter Inhalt auf Seiten oder sogar als Kanonisierungsproblem gelten:

  • URLs mit „www.“ im Vergleich zu denen ohne
  • Haben Sie eine URL mit und ohne Großbuchstaben – es wird empfohlen, so viel Kleinbuchstaben wie möglich zu verwenden.
  • URLs mit und ohne abschließenden Schrägstrich „/“ am Ende der Webadresse
  • URLs für Seiten mit gescrapten oder syndizierten Inhalten – Scraping ist illegal, die Syndizierung von Inhalten ist jedoch zulässig, wenn Sie auf den ursprünglichen Eigentümer verlinken. Die Syndizierung wird zu einem Problem, wenn Google Ihre URL als kanonische Version der Originalseite vorzieht. Hierbei handelt es sich in höherem Maße um Content-Diebstahl, der in diesem Fall geklärt werden muss.
  • URLs mit und ohne „index.html“.
  • URL-Standortvarianten mit demselben Inhalt
  • URLs für mobile Geräte
  • URL-Versionen, die von Social-Media-Websites weiterleiten
  • URL-Parameter, unabhängig davon, ob sie den Inhalt der Seite ändern oder nicht, werden am Ende von URLs hinzugefügt, z. B. Facettennavigation, Tracking-Codes, Sitzungs-IDs, Sortierinhalte usw.
  • Alle Seiten, die denselben vollständigen Inhalt wie eine andere Seite anzeigen, können Google verwirren und dazu führen, dass das falsche Canonical ausgewählt wird, einschließlich der Hauptseite für den Blog, Kategorieseiten, Tag-Seiten, paginierten Seiten oder Feed-Seiten.

Denken Sie daran, dass Konsistenz bei der Standortpräferenz von entscheidender Bedeutung ist. Strukturieren Sie Ihre URLs so einheitlich wie möglich, um doppelte Inhalte und Probleme bei der Kanonisierung zu minimieren.

Erfahren Sie mehr über Kanonisierung und Duplicate Content! Ruf uns jetzt an!

Hreflang

Rules | A Chalkboard With Letters In It Obwohl Hreflang auf einigen Websites Duplizierungsprobleme lösen kann, funktioniert es auf internationalen Websites nicht. Standardmäßig wählt Google die richtige Website-Version und versucht, zu einer lokalen Version zu wechseln. Dies funktioniert jedoch nicht immer, da die lokale Version nicht die führende Site ist und Probleme verursachen kann. Wenn dies der Fall ist, werden den Benutzern am Ende Webseiten angezeigt, die für Benutzer in einem anderen Land bestimmt sind. Da das System von Google nicht dafür eingerichtet ist, dies richtig zu regeln, werden Website-Besitzer dazu angehalten, mehrsprachige Seiten zu veröffentlichen, beispielsweise mit zumindest leicht unterschiedlichen Inhalten (auch wenn es sich bei dem Inhalt um eine einfache Übersetzung handelt).

Bei JavaScript-Sites, in der Regel solche, die auf App-Shell-Modellen basieren, kann der Code, der zuerst auf den Seiten erscheint, sehr ähnlich zu anderen Seiten und sogar zum Code auf verschiedenen Websites gelesen werden. Aus diesem Grund können die Seiten manchmal als Teil anderer Seitencluster (z. B. anderer Websites) oder für andere Seiten auf derselben Domänenebene kanonisiert werden.

Denken Sie daran, dass Google Algorithmen verwendet und die Duplikaterkennung höchstwahrscheinlich in automatischen Zyklen durchführt. Dies kann Teil des Problems sein. Wenn Google die Seiten beim Erkennen des Codes als Duplikate markiert und sie nicht vollständig crawlt, ist es möglich, dass es sie nicht korrekt austauschen kann, da sie basierend auf dem HTML-Inhalt wie eine andere Seite aussehen. Dies bedeutet, dass es beim Rendern der Seite zu Verzögerungen kommt, da sie bereits als Duplikat markiert wurde. Als Ihre White-Label-Experten können wir Ihnen mit unseren White-Label-Diensten für digitale Werbung und SEO weiterhelfen.