Canonicalizzazione e contenuto duplicato

Pubblicato: 2023-05-13

Canonicalization and Duplicate Content | A Full Of Colorful Jewels

La maggior parte delle persone ha più versioni di un URL che indirizzano a versioni separate ma simili del proprio sito web. Ci sono un paio di ragioni per questo. Innanzitutto, il proprietario del sito può suddividere i test su diversi elementi o monitorare il traffico proveniente da altri luoghi, come i siti di social media.

Da ciò nascono alcune domande. Innanzitutto, quali versioni del sito Web vengono indicizzate e diventano quelle che Google visualizza nelle pagine dei risultati affinché gli utenti possano vederle? A cosa guarda Google quando determina quale versione è quella principale o "canonica" che si posiziona nelle SERP? I proprietari dei siti verranno penalizzati per avere queste pagine di contenuti duplicati?

Questo processo è chiamato canonicalizzazione, normalizzazione o standardizzazione e oggi risponderemo a queste domande per te e ti forniremo un concetto più preciso di canonicalizzazione. Approfondiremo le nozioni di base, i segnali che Google osserva e esamineremo scenari di esempio in cui vengono utilizzate più versioni del sito e contenuti duplicati. Queste sono solo informazioni essenziali, quindi consulta i servizi SEO white label se hai bisogno di maggiori informazioni o aiuto con problemi di canonicalizzazione.

Facciamo un salto!

Alla ricerca di esperti SEO White Label? Contattaci ora!

L'etichetta canonica

The Canonical Tag | An Arrow Pointing To A WebsIte Un tag canonico è un codice che puoi inserire nella sezione "<head>" del codice della tua pagina o nell'intestazione HTTP. Questo informa i motori di ricerca che questa versione del tuo URL è quella per cui desideri classificarti, quella che Google mostra agli utenti che effettuano ricerche. Quando i motori di ricerca eseguono la scansione dei siti Web e si imbattono in contenuti duplicati o simili, inclusi questi tag, chiarisce che una versione dell'URL è quella che preferisci venga indicizzata.

Ecco come appare:

<link rel=”canonical” https://www.yourwebsitehere.com />

(Assicurati che il codice sia inserito e chiuso correttamente.)

Tuttavia, vale la pena notare che questo è solo uno degli altri segnali dei controlli di Google. Google esamina diversi fattori e il tag canonico potrebbe persino essere trascurato a favore di un segnale diverso.

Segnali di canonicalizzazione

Quindi, come fa Google a determinare quale URL è la versione "canonica"?

John Mueller di Google spiega che ci sono due linee guida generali quando si sceglie l'URL canonico:

  1. Preferenza del sito: ciò che il sito dice a Google che vuole che sia l'URL canonico
  2. Preferenze dell'utente: quale URL Google determina è più vantaggioso per il ricercatore

Le cose che Google guarda per quanto riguarda la preferenza del sito:

  • Tag canonico (link rel canonical)
  • Quale URL si trova nel file della mappa del sito
  • Collegamento interno
  • Reindirizzamenti
  • URL HTTPS
  • URL che hanno un aspetto migliore/più pulito

Mueller dice che tengono conto di tutti questi elementi e scelgono quello canonico in base a quale URL incorpora queste cose al meglio. Consiglia inoltre ai proprietari di siti che se preferiscono quali URL mostrare agli utenti, devono applicare queste preferenze in modo coerente sui loro siti web. Ancora una volta, la SEO locale white label è utile se disponi di risorse limitate in quest'area.

Altri fattori nel processo di canonicalizzazione includono duplicati, collegamenti esterni e Hreflang.

Google esamina diversi fattori e il tag canonico potrebbe persino essere trascurato a favore di un segnale diverso. Fai clic per twittare

Contenuto duplicato

Duplicate Content | A Laptop That Has An Image Of A Spaceship Contenuti duplicati o molto simili possono esistere per vari motivi, intenzionali o meno, e possono causare molti problemi durante il posizionamento. La canonicalizzazione può mitigare questi problemi. Anche se il contenuto duplicato non ti farà guadagnare una penalità di per sé, ciò non significa che sia del tutto privo di conseguenze.

Principalmente, i contenuti duplicati potrebbero ritardare la visualizzazione delle pagine del sito corrette nelle pagine dei risultati. Ad esempio, se hai due pagine simili classificate per le parole chiave esatte, potrebbero competere o ci vorrà del tempo a Google per determinare quale posizionare nelle SERP. Anche quando Google ci riesce, potrebbe non mostrare quella che preferisci o la versione in cui ti impegni di più. Google sta migliorando nell'identificare quali pagine offrono la migliore esperienza utente. Tuttavia, i contenuti di valore a volte possono rimanere sepolti sotto duplicati eccessivi come un ago in una pila di stuzzicadenti, simili nella forma ma non nell'essenza. Puoi semplificare questo processo attraverso pratiche di canonicalizzazione.

Regole di canonicalizzazione duplicate di Google

In termini di URL, Google sceglierà spesso una versione dell'URL più pulita e più breve rispetto a una più lunga e che include parametri. Inoltre, Google preferirà spesso HTTPS alla versione HTTP di un sito.

Quando Google incontra contenuti duplicati su una pagina, sceglierà una versione canonica da indicizzare. Questa sarà la versione che determina essere la migliore. Tutte le pagine identificate come duplicate formeranno un gruppo di pagine. I segnali vengono inviati alle pagine all'interno di quel cluster e fungono da consolidatore che punta al canonico scelto. Tieni presente che il canonico determinato da Google può ancora cambiare nel tempo a seconda del ranking di Google e dei fattori di indicizzazione.

Di seguito sono riportati alcuni esempi di casi che sono considerati contenuti duplicati nelle pagine o addirittura problemi di canonizzazione:

  • URL con "www". contro quelli senza
  • Avere un URL con e senza lettere maiuscole: si consiglia di utilizzare il più possibile minuscole.
  • URL con e senza barre finali "/" alla fine dell'indirizzo web
  • URL per pagine contenenti contenuti di scraping o syndication: lo scraping è illegale, ma la syndication di contenuti è consentita se ci si collega al proprietario originale. La syndication diventa un problema se Google sceglie il tuo URL come versione canonica rispetto al sito originale. Questo è un furto di contenuto a un livello più elevato e deve essere risolto se ciò accade.
  • URL con e senza "index.html".
  • Varianti di località dell'URL con gli stessi contenuti
  • URL per dispositivi mobili
  • Versioni URL che reindirizzano dai siti di social media
  • I parametri URL, indipendentemente dal fatto che modifichino o meno il contenuto della pagina, vengono aggiunti alla fine degli URL, come la navigazione con facet, i codici di tracciamento, gli ID di sessione, l'ordinamento dei contenuti, ecc.
  • Qualsiasi pagina che mostra lo stesso contenuto completo di un'altra pagina può confondere Google e causare la selezione del canonico errato, inclusa la pagina principale del blog, le pagine delle categorie, le pagine dei tag, le pagine impaginate o le pagine dei feed.

Ricorda, la coerenza è fondamentale quando si tratta di preferenza del sito. Struttura i tuoi URL nel modo più uniforme possibile per ridurre al minimo i contenuti duplicati e i problemi di canonicalizzazione.

Ulteriori informazioni sulla canonicalizzazione e sui contenuti duplicati! Chiamaci ora!

Hreflang

Rules | A Chalkboard With Letters In It Sebbene Hreflang possa risolvere problemi di duplicazione su alcuni siti, non funziona su siti internazionali. Per impostazione predefinita, Google sceglierà la versione corretta del sito Web e proverà a passare a una versione locale. Tuttavia, non sempre funziona perché la versione locale non è il sito principale e può causare problemi. In tal caso, ciò che accade è che gli utenti finiscono per ricevere pagine di siti Web destinate a utenti di un altro paese. Poiché il sistema di Google non è impostato per risolvere correttamente questo problema, i proprietari di siti Web sono incoraggiati a pubblicare pagine multilingue, ad esempio, con contenuti almeno leggermente diversi (anche se il contenuto è una semplice traduzione).

Per i siti JavaScript, in genere quelli costruiti su modelli di shell dell'app, il codice che appare per primo nelle pagine può essere letto in modo molto simile ad altre pagine e persino al codice su vari siti web. Per questo motivo, a volte le pagine possono essere canonizzate come parte di altri cluster di pagine (ad esempio, altri siti Web) o in altre pagine sullo stesso livello di dominio.

Ricorda che Google utilizza algoritmi e molto probabilmente esegue il rilevamento dei duplicati su cicli automatici. Questo può essere parte del problema. Se Google contrassegna le pagine come duplicate quando vede il codice e non le esegue completamente la scansione, è possibile che non sia in grado di scambiarle correttamente perché sembra un'altra pagina basata sul contenuto HTML. Ciò significa che ci sarà un ritardo nel rendering della pagina perché è già stata contrassegnata come duplicata. In qualità di esperti in white label, possiamo aiutarti con i nostri servizi di pubblicità digitale e SEO white label.