Paginação – um elemento crucial da indexação do Search Engine
Publicados: 2017-11-08Índice
Diretrizes de SEO sobre paginação, por exemplo, de categorias de lojas online ou artigos de blogs, são um assunto recorrente e existem algumas abordagens para isso. Vamos discutir como lidar com a paginação para ajudar os rastreadores da Web a processar o conteúdo com mais facilidade.
O que é paginação?
Paginação é simplesmente dividir um recurso específico em um site em páginas. O exemplo mais simples pode ser categorias na maioria das lojas online onde, após listar um número específico de produtos, o usuário pode ir para a próxima parte da lista de produtos. Outra forma de apresentar produtos dentro de uma categoria é a paginação de rolagem infinita onde quando o usuário rola para baixo, novos e novos produtos são exibidos. É o mesmo para blogs. Geralmente, não importa qual recurso de um site é dividido em partes, é mais sobre como você faz isso e como você notifica o Googlebot sobre o conteúdo que segue.
Deixe os rastreadores da Web fazerem o que fazem
Um dos erros básicos cometidos durante a paginação é usar tags canônicas na primeira página de paginação. E mesmo que seja justificado em uma situação, geralmente é feito de forma incorreta.
Se, por exemplo, uma categoria de produto for dividida em algumas páginas, significa que a página base inclui um número específico de produtos, a segunda página inclui outro grupo de produtos e assim sucessivamente, até a última página de paginação.
As páginas de paginação são as seguintes:
https://website.com/ product-category/page-2
https://website.com/ product-category/page-3
https://website.com/product-category/page-4
etc.
portanto, não faz muito sentido usar esses links canônicos:
<link rel="canonical" href="https://website.com/product-category" />
devido ao fato de ser mais uma parte dos produtos de uma determinada categoria, as páginas 2,3,4, etc. não são duplicatas da página principal (a menos que não seja o caso, é razoável usar um link canônico) .
Naturalmente, você pode fornecer links canônicos, mas para eles mesmos . Nesse caso, insira o seguinte na página https://website.com/product-category/ :
<link rel="canonical" href="https://website.com/product-category" />
e o seguinte na página https://website.com/product-category/page-2:
<link rel="canonical" href="https://website.com/product-category/page-2" />
Uma página com todo o conteúdo
Há uma exceção – uma página base com todo o conteúdo , adicionalmente dividida em algumas subpáginas com menos conteúdo. Em tal situação, faz sentido usar um link canônico. É uma prática muito utilizada em artigos bastante longos e com muito conteúdo.
Assim, as seguintes páginas:
https://website.com/product-category/page-1
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
combinados em uma única sequência lógica incluirá, de fato, todo o conteúdo da página de base https://website.com/product-category/ que você deseja usar para indexação do mecanismo de pesquisa.
Esta infeliz primeira página de paginação…
Outro erro é duplicar a página base da categoria https://website.com/product-category/ com a primeira página de paginação https://website.com/product-category/page-1
Se a página base inclui o mesmo conteúdo que /page-1, então é inútil fazer uma duplicata – certos sistemas de gerenciamento de conteúdo normalmente geram (ao lado de uma página base) a primeira página de paginação começando com /page-1; nesse caso , o endereço deve, por exemplo, ser redirecionado para a página base usando Redirect 301 e, no código, você deve fornecer um link não para https://website.com/product-category/page-1, mas para https://website. com/product-category/
Caso contrário, você encontrará um problema de redirecionamento interno, desperdiçando o orçamento de rastreamento do Googlebot para rastrear um determinado site. Em outras palavras, não adianta redirecioná-lo com um link interno usando o Redirecionamento 301 quando você pode vincular diretamente à página de destino usando o código de status HTTP 200.
Os atributos rel=“next”andrel=“prev”
Se você decidir paginar da seguinte forma:
https://website.com/product-category/
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
então você pode indicar relacionamentos entre páginas individuais para um rastreador. Fornecer links relevantes com atributos rel na seção <head> destaca páginas individuais de uma sequência.
Na primeira página (base) , coloque o seguinte:
<link rel="next" href="https://website.com/product-category/page-2">
como outra página contendo uma parte do mesmo recurso.
Na próxima página , ou seja, https://website.com/product-category/page-2, coloque o seguinte:
<link rel="prev" href="https://website.com/product-category/"> <link rel="next" href="https://website.com/product-category/page-3">
Seguindo em frente, na terceira página, ou seja, https://website.com/product-category/page-3:
<link rel="prev" href="https://website.com/product-category/page/page-2"> <link rel="next" href="https://website.com/product-category/page-4">
Supondo que /page-4 seja a última na sequência de paginação , coloque o seguinte:
<link rel="prev" href="https://website.com/product-category/page-3">
É a combinação de links mais usada em um cabeçalho com atributos “rel next/prev”. Às vezes, há atributos adicionados aos links “<a href=" no código (por exemplo, abaixo da lista), embora seja melhor colocá-los na seção <head> – quanto mais cedo um rastreador souber onde está o restante do recurso , o melhor.
Você precisa lembrar que links com atributos “rel next/prev” não são diretivas absolutas , ou seja, eles podem, mas não precisam, ser levados em consideração durante o rastreamento de um site. Além disso, vale a pena usar caminhos absolutos para páginas subsequentes, embora as diretrizes do Google digam que “os valores podem ser caminhos absolutos e caminhos relativos”. No entanto, no caso de uma página com parâmetros em uma URL, por exemplo, parâmetros de classificação, eles também devem ser colocados em links “rel next/prev” – por exemplo, a seguinte página:
https://website.com/product-category/page-3&sort=desc
incluirá os seguintes links na seção <head>:
<link rel="prev" href="https://website.com/product-category/page-2&sort=desc"> <link rel="next" href="https://website.com/product-category/page-4&sort=desc">
mas uma tag canônica apontando apenas para si mesma (sem o parâmetro de classificação em ordem decrescente):
<link rel="canonical" href="https://website.com/product-category/page-3"/>
Indexar ou não indexar?
Outro problema enfrentado durante a paginação é o uso indevido de meta-tags de robôs. O Google alegou que as páginas individuais devem ser consideradas como uma sequência lógica que resultará na consideração dos atributos de seus links e, na maioria dos casos, ajudará o usuário a exibir a primeira página.
Muitas vezes, as páginas de paginação individuais, apesar de estarem conectadas umas às outras com links com atributos “rel next/prev”, estão no índice do mecanismo de busca. Se você tiver um problema com isso, será melhor usar o seguinte:
<meta name="robots" content="noindex, follow" />
nas páginas subseqüentes, ou seja, em /page-2 e superior. Um rastreador da Web rastreará os links até a última página paginada, mas não os indexará.
Então e os canônicos?
Decorre claramente da discussão com John Mueller (https://plus.google.com/+JohnELincoln/posts/TCJHwdZHdQc) que você não deve combinar metatags 'sem índice' com canônicos apontando para um URL indexável. Portanto, neste caso, se um link canônico em uma página de paginação direciona para si mesmo, uma metatag 'sem índice' não deve ser colocada e vice-versa.
Não notei nenhum problema com o rastreamento de páginas paginadas com links canônicos para as próprias páginas e a metatag 'sem índice'; no entanto, o Google quer decidir por conta própria o que indexar e o que não indexar, então talvez devêssemos deixar o Google fazer isso.
Paginação e um mapa do site XML do site
Aqui está um caso interessante: você prefere não inserir links de paginação em um sitemap.xml, mas apenas o endereço base de, por exemplo, uma categoria ou o artigo principal com todo o conteúdo. Em princípio, em um sitemap XML devem ser inseridos os endereços que você deseja indexar, portanto, se você não se importa com a indexação de paginação, não inclua URLs para /page-2 e superior. Naturalmente, se você bloqueá-lo com uma metatag de robôs 'sem índice', é ainda mais simples – não os forneça.
Páginas de paginação como parâmetros
Se você deseja oferecer suporte à indexação de produtos/artigos da última página paginada, forneça aos rastreadores da Web acesso ilimitado a páginas de outras categorias além da categoria base. Muitas vezes, as páginas individuais têm os parâmetros “ ?page= ” ou “ ?p= ” e podem ser bloqueadas por engano no robots.txt junto com o restante dos parâmetros.
É semelhante para parâmetros de URL no Google Search Console . Vale mostrar ao Googlebot que tais parâmetros são responsáveis por dividir os recursos em páginas e deixar o bot decidir.
Paginação e descrições de categorias
Uma prática seguida com frequência é estender o conteúdo da categoria, por exemplo, em lojas online. Muitas vezes acontece que uma descrição adicionada é exibida em todos os URLs de paginação de forma inalterada. Se todas as páginas são tratadas como uma sequência lógica e combinadas em um todo pelos atributos “rel next/prev”, então parece desnecessário duplicar o mesmo texto em /page-2, /page-3, etc.
É semelhante no que diz respeito aos produtos listados: cada página subsequente exibe um novo conjunto de produtos, e o usuário não deseja ler a mesma descrição da categoria o tempo todo em cada página nem ver os mesmos produtos na categoria . Mas há uma pergunta – quem lê as descrições das categorias? O Googlebot provavelmente tem, então não o alimente com duplicatas.
Você precisa de paginação se usar uma rolagem infinita?
Acontece que a paginação é uma opção viável também na solução 'rolagem infinita', onde ao rolar a lista de produtos/artigos dentro de uma categoria, novos recursos são exibidos. John Mueller (http://scrollsample.appspot.com/items) forneceu um exemplo sensato: ao rolar a lista, novos parâmetros apontando para as páginas subsequentes são adicionados à URL.
http://scrollsample.appspot.com/items?page=2
http://scrollsample.appspot.com/items?page=3
e assim por diante.
Obviamente, aqui são usados links com atributos “rel next/prev” e desde que seja um link canônico para si mesmo; por exemplo, em http://scrollsample.appspot.com/items?page=5, é o seguinte:
<link rel="canonical" href="/items?page=5" /> <link rel="next" href="/items?page=6"/> <link rel="prev" href="/items?page=4"/>
A paginação como elemento de uma estratégia de indexação
A decisão de aplicar uma solução de paginação específica é naturalmente sua. Os exemplos anteriores não são opções perfeitas em todas as situações porque você pode encontrar dificuldades técnicas, problemas de CMS ou simplesmente é contrário a uma estratégia de indexação adotada. No entanto, vale a pena otimizar a paginação de tal forma que pelo menos não impeça o Googlebot de rastrear o site, além de promover a indexação de páginas de produtos/artigos enterradas que não são tão facilmente acessíveis durante uma única visita.