Impaginazione: un elemento cruciale dell'indicizzazione dei motori di ricerca
Pubblicato: 2017-11-08Sommario
Le linee guida SEO sull'impaginazione, ad esempio delle categorie del negozio online o degli articoli del blog, sono un argomento ricorrente e ci sono alcuni approcci ad esso. Discuteremo come affrontare l'impaginazione per aiutare i web crawler a elaborare i contenuti più facilmente.
Cos'è l'impaginazione?
L'impaginazione consiste semplicemente nel dividere una specifica risorsa su un sito Web in pagine. L'esempio più semplice può essere costituito dalle categorie nella maggior parte dei negozi online in cui dopo aver elencato un numero specifico di prodotti l'utente può passare alla parte successiva dell'elenco di prodotti. Un altro modo per presentare i prodotti all'interno di una categoria è l'impaginazione a scorrimento infinito in cui quando l'utente scorre verso il basso, vengono visualizzati nuovi e nuovi prodotti. È lo stesso per i blog. In genere, non importa quale risorsa di un sito Web sia divisa in parti, si tratta più di come lo fai e di come comunichi a Googlebot i contenuti che seguono.
Consenti ai web crawler di fare quello che fanno
Uno degli errori di base commessi durante l'impaginazione è l'utilizzo di tag canonici nella prima pagina di impaginazione. E anche se è giustificato in una situazione, di solito è fatto in modo errato.
Se, ad esempio, una categoria di prodotto è suddivisa in poche pagine, significa che la pagina base comprende un determinato numero di prodotti, la seconda pagina include un altro gruppo di prodotti, e così via, fino all'ultima pagina di impaginazione.
Le pagine di impaginazione sono le seguenti:
https://website.com/categoria-prodotto/pagina-2
https://website.com/categoria-prodotto/pagina-3
https://website.com/product-category/page-4
eccetera.
pertanto, non ha molto senso utilizzare tali link canonici:
<link rel="canonical" href="https://website.com/product-category" />
poiché si tratta di un'ulteriore parte dei prodotti di una determinata categoria, le pagine 2,3,4, ecc. non sono duplicati della pagina principale (a meno che non sia il caso, è ragionevole utilizzare un collegamento canonico) .
Naturalmente, puoi fornire link canonici, ma a se stessi . In tal caso, inserire quanto segue nella pagina https://website.com/product-category/ :
<link rel="canonical" href="https://website.com/product-category" />
e quanto segue a pagina https://website.com/product-category/page-2:
<link rel="canonical" href="https://website.com/product-category/page-2" />
Una pagina con tutti i contenuti
C'è un'eccezione: una pagina di base con tutto il contenuto , ulteriormente divisa in alcune sottopagine con meno contenuto. In una situazione del genere, ha senso utilizzare un collegamento canonico. È una pratica usata spesso in articoli piuttosto lunghi con molto contenuto.
Così, le seguenti pagine:
https://website.com/product-category/page-1
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
combinato in un'unica sequenza logica includerà infatti tutto il contenuto della pagina di base https://website.com/product-category/ che si desidera utilizzare per l'indicizzazione dei motori di ricerca.
Questa sfortunata prima pagina di impaginazione...
Ancora un altro errore è la duplicazione della pagina di base della categoria https://website.com/product-category/ con la prima pagina di impaginazione https://website.com/product-category/page-1
Se la pagina di base include lo stesso contenuto di /pagina-1, è inutile fare un duplicato: alcuni sistemi di gestione dei contenuti normalmente generano (accanto a una pagina di base) la prima pagina di impaginazione che inizia con /pagina-1; in tal caso , l'indirizzo dovrebbe ad esempio essere reindirizzato alla pagina di base utilizzando Redirect 301 e nel codice dovresti fornire un collegamento non a https://website.com/product-category/page-1 ma piuttosto a https://website. com/categoria-prodotto/
In caso contrario, incontrerai un problema di reindirizzamento interno, sprecando così il budget di scansione di Googlebot per la scansione di un determinato sito web. In altre parole, non serve reindirizzarlo con un collegamento interno utilizzando Reindirizzamento 301 quando è possibile collegarsi direttamente alla pagina di destinazione utilizzando il codice di stato HTTP 200.
Gli attributi rel="next"andrel="prev".
Se decidi di impaginare come segue:
https://website.com/categoria-prodotto/
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
quindi puoi indicare le relazioni tra le singole pagine a un crawler. Fornire collegamenti pertinenti con attributi rel nella sezione <head> evidenzia le singole pagine di una sequenza.
Nella prima pagina (di base) , inserisci quanto segue:
<link rel="next" href="https://website.com/product-category/page-2">
come un'altra pagina contenente una parte della stessa risorsa.
Nella pagina successiva , ad esempio https://website.com/product-category/page-2, inserisci quanto segue:
<link rel="prev" href="https://website.com/product-category/"> <link rel="next" href="https://website.com/product-category/page-3">
Proseguendo, nella terza pagina, ovvero https://website.com/product-category/page-3:
<link rel="prev" href="https://website.com/product-category/page/page-2"> <link rel="next" href="https://website.com/product-category/page-4">
Supponendo che /page-4 sia l'ultimo nella sequenza di impaginazione , inserisci quanto segue:
<link rel="prev" href="https://website.com/product-category/page-3">
È la combinazione di collegamenti più utilizzata in un'intestazione con attributi "rel next/prev". A volte ci sono attributi aggiunti ai link "<a href=" nel codice (ad es. sotto l'elenco), anche se è meglio inserirli nella sezione <head> , prima un crawler ottiene un'idea di dove si trova il resto della risorsa , meglio è.
È necessario ricordare che i collegamenti con attributi "rel next/prev" non sono direttive assolute , ovvero possono, ma non devono, essere presi in considerazione durante la scansione di un sito Web. Inoltre, vale la pena utilizzare percorsi assoluti per le pagine successive, sebbene le linee guida di Google affermino che "i valori possono essere percorsi assoluti e percorsi relativi". Tuttavia, nel caso di una pagina con parametri in un URL, ad esempio parametri di ordinamento, dovrebbero essere inseriti anche nei collegamenti "rel next/prev", ad esempio la pagina seguente:
https://website.com/product-category/page-3&sort=desc
includerà i seguenti collegamenti nella sezione <head>:
<link rel="prev" href="https://website.com/product-category/page-2&sort=desc"> <link rel="next" href="https://website.com/product-category/page-4&sort=desc">
ma un tag canonico che punta solo a se stesso (senza il parametro di ordinamento in ordine decrescente):
<link rel="canonical" href="https://website.com/product-category/page-3"/>
Indicizzare o non indicizzare?
Un altro problema affrontato durante l'impaginazione è l'uso improprio dei meta-tag dei robot. Google ha affermato che le singole pagine devono essere considerate come una sequenza logica che comporterà la presa in considerazione degli attributi dei loro collegamenti e nella maggior parte dei casi aiuterà l'utente a visualizzare la prima pagina.
Molto spesso accade che singole pagine di impaginazione, pur essendo collegate tra loro da link con attributi “rel next/prev”, si trovino nell'indice dei motori di ricerca. Se hai un problema con questo, sarà meglio usare quanto segue:
<meta name="robot" content="noindex, segui" />
nelle pagine successive, ovvero in /page-2 e successive. Un web crawler eseguirà la scansione dei collegamenti fino all'ultima pagina impaginata, ma non li indicizzerà.
Allora che dire dei canonici?
Dalla discussione con John Mueller (https://plus.google.com/+JohnELincoln/posts/TCJHwdZHdQc) risulta chiaramente che non dovresti combinare i meta tag "nessun indice" con i canonici che puntano a un URL indicizzabile. Pertanto, in questo caso, se un collegamento canonico su una pagina di impaginazione indirizza a se stesso, non deve essere inserito un meta tag 'no index' e viceversa.
Non ho notato alcun problema con la scansione di pagine impaginate con link canonici alle pagine stesse e il meta tag "no index"; tuttavia, Google vuole decidere da solo cosa indicizzare e cosa non indicizzare, quindi forse dovremmo lasciare che lo faccia Google.
Impaginazione e una sitemap XML del sito web
Ecco un caso interessante: si preferisce non inserire i link di impaginazione in un sitemap.xml, ma solo l'indirizzo di base, ad esempio, di una categoria o dell'articolo principale con tutto il contenuto. In linea di principio, in una mappa del sito XML dovrebbero essere inseriti quegli indirizzi che vuoi indicizzare, quindi se non ti interessa l'indicizzazione della paginazione, non includere gli URL a /page-2 e superiori. Naturalmente, se lo blocchi con un meta tag robots "no index", è ancora più semplice: non fornirli.
Pagine di impaginazione come parametri
Se desideri supportare l'indicizzazione di prodotti/articoli dall'ultima pagina impaginata, fornisci ai web crawler un accesso illimitato a pagine di altre categorie oltre la categoria di base. Capita spesso che le singole pagine abbiano parametri “ ?page= ” o “ ?p= ” e possano essere bloccate erroneamente in robots.txt insieme al resto dei parametri.
È simile per i parametri URL in Google Search Console . Vale la pena mostrare a Googlebot che tali parametri sono responsabili della divisione delle risorse in pagine e della decisione del bot.
Impaginazione e descrizioni delle categorie
Una pratica seguita di frequente è l'estensione del contenuto della categoria, ad esempio nei negozi online. Succede spesso che una descrizione aggiunta venga visualizzata su tutti gli URL di impaginazione in forma invariata. Se tutte le pagine vengono trattate come una sequenza logica e combinate in un tutto dagli attributi "rel next/prev", non sembra necessario duplicare lo stesso testo su /page-2, /page-3, ecc.
È simile per quanto riguarda i prodotti elencati: ogni pagina successiva mostra un nuovo set di prodotti e l'utente non vuole né leggere la stessa descrizione della categoria tutto il tempo su ogni pagina né guardare gli stessi prodotti più all'interno della categoria . C'è una domanda però: chi legge le descrizioni delle categorie? Probabilmente Googlebot lo fa, quindi non alimentarlo con duplicati.
Hai bisogno dell'impaginazione se usi uno scroll infinito?
Si scopre che l'impaginazione è un'opzione praticabile anche nella soluzione 'scorrimento infinito', dove scorrendo l'elenco di prodotti/articoli all'interno di una categoria, vengono visualizzate nuove risorse. John Mueller (http://scrollsample.appspot.com/items) ha fornito un esempio sensato: durante lo scorrimento dell'elenco, all'URL vengono aggiunti nuovi parametri che puntano alle pagine successive.
http://scrollsample.appspot.com/items?page=2
http://scrollsample.appspot.com/items?page=3
E così via e così via.
Ovviamente, qui vengono utilizzati collegamenti con attributi "rel next/prev" e viene fornito un collegamento canonico a se stesso; ad esempio, all'indirizzo http://scrollsample.appspot.com/items?page=5, è il seguente:
<link rel="canonical" href="/items?page=5" /> <link rel="next" href="/items?page=6"/> <link rel="prev" href="/items?page=4"/>
L'impaginazione come elemento di una strategia di indicizzazione
La decisione di applicare una particolare soluzione di impaginazione spetta naturalmente a te. Gli esempi precedenti non sono opzioni perfette in ogni situazione perché potresti incontrare difficoltà tecniche, problemi CMS o semplicemente è contrario ad una strategia di indicizzazione adottata. Tuttavia, vale la pena ottimizzare l'impaginazione in misura tale da non impedire almeno a Googlebot di eseguire la scansione del sito Web, oltre a favorire l'indicizzazione delle pagine di prodotti/articoli sepolti che non sono così facilmente accessibili durante una singola visita.