Canonização e conteúdo duplicado

Publicados: 2023-05-13

Canonicalization and Duplicate Content | A Full Of Colorful Jewels

A maioria das pessoas tem várias versões de um URL que direcionam para versões separadas, mas semelhantes, de seu site. Existem algumas razões para isso. Primeiro, o proprietário do site pode testar diferentes elementos ou rastrear o tráfego de outros lugares, como sites de mídia social.

Algumas questões surgem a partir disso. Primeiro, quais versões do site são indexadas e se tornam as que o Google exibe em suas páginas de resultados para os usuários verem? O que o Google analisa ao determinar qual versão é a principal ou “canônica” classificada nas SERPs? Os proprietários de sites serão penalizados por terem essas páginas de conteúdo duplicadas?

Esse processo é chamado de canonização, normalização ou padronização, e responderemos a essas perguntas para você hoje e forneceremos um conceito mais preciso de canonização. Vamos nos aprofundar no básico, em quais sinais o Google analisa e em cenários de exemplo em que várias versões de site e conteúdo duplicado são usados. Esta é apenas uma informação essencial, portanto, consulte os serviços de SEO de marca branca se precisar de mais informações ou ajuda com problemas de canonização.

Vamos entrar!

Procurando por especialistas em SEO White Label? Entre em contato conosco agora!

A etiqueta canônica

The Canonical Tag | An Arrow Pointing To A WebsIte Uma tag canônica é um código que você pode inserir na seção “<head>” do código da sua página ou no cabeçalho HTTP. Isso informa aos mecanismos de pesquisa que esta versão do seu URL é aquela para a qual você deseja classificar – aquela que o Google mostra aos pesquisadores. Quando os mecanismos de pesquisa rastreiam sites e encontram conteúdo duplicado ou semelhante, incluindo essas tags, fica claro que uma versão de URL é aquela que você prefere que seja indexada.

Isto é o que parece:

(Certifique-se de que o código foi inserido e fechado corretamente.)

No entanto, vale a pena notar que este é apenas um dos outros sinais que o Google verifica. O Google analisa vários fatores, e a tag canônica pode até ser negligenciada em favor de um sinal diferente.

Sinais de Canonização

Então, como o Google determina qual URL é a versão “canônica”?

John Mueller, do Google, explica que existem duas diretrizes gerais ao escolher o URL canônico:

Preferência do site – o que o site diz ao Google que deseja que o URL canônico seja
Preferência do usuário – qual URL o Google determina é mais benéfico para o pesquisador

As coisas que o Google analisa em relação à preferência do site:

Tag canônica (link rel canonical)
Qual URL está no arquivo de mapa do site
Links internos
Redirecionamentos
URLs HTTPS
URLs com aparência melhor/mais limpa

Mueller diz que eles levam em consideração todos esses elementos e escolhem o canônico com base em qual URL incorpora essas coisas melhor. Ele também aconselha os proprietários de sites que, se preferirem quais URLs mostrar aos pesquisadores, devem aplicar essas preferências de forma consistente em seus sites. Novamente, o SEO local de marca branca é útil se você tiver recursos limitados nessa área.

Outros fatores no processo de canonização incluem duplicatas, links externos e Hreflang.

O Google analisa vários fatores, e a tag canônica pode até ser negligenciada em favor de um sinal diferente. Clique para tweetar

Conteúdo duplicado

Duplicate Content | A Laptop That Has An Image Of A Spaceship Conteúdo duplicado ou muito semelhante pode existir por vários motivos, intencionais ou não, e pode causar muitos problemas ao classificar. A canonização pode mitigar esses problemas. Embora o conteúdo duplicado não lhe dê uma penalidade per se, isso não significa que seja totalmente sem consequências.

Principalmente, o conteúdo duplicado pode atrasar a exibição das páginas certas do site nas páginas de resultados. Por exemplo, se você tiver duas páginas semelhantes classificadas para as palavras-chave exatas, elas podem competir ou levará tempo para o Google determinar qual delas colocar nas SERPs. Mesmo quando o Google faz isso, pode não mostrar aquela que você prefere ou a versão na qual você se esforça mais. O Google está melhorando em identificar quais páginas oferecem a melhor experiência do usuário. Ainda assim, às vezes, o conteúdo valioso pode ser enterrado sob duplicatas excessivas, como uma agulha em uma pilha de palitos – semelhante em forma, mas não em essência. Você pode simplificar esse processo por meio de práticas de canonização.

Regras de canonização duplicadas do Google

Em termos de URLs, o Google geralmente escolhe uma versão de URL mais limpa e curta em vez de uma versão mais longa e que inclui parâmetros. Além disso, o Google geralmente prefere HTTPS à versão HTTP de um site.

Quando o Google encontra conteúdo duplicado em uma página, ele escolhe uma versão canônica para indexar. Esta será a versão que determina ser a melhor. Todas as páginas identificadas como duplicadas formarão um agrupamento de páginas. Os sinais são enviados para as páginas desse cluster e atuam como um consolidador que aponta para o canônico escolhido. Observe que o canônico que o Google determina ainda pode mudar com o tempo, dependendo da classificação do Google e dos fatores de indexação.

A seguir estão alguns exemplos de casos que são considerados conteúdo duplicado em páginas ou até mesmo problemas de canonização:

URLs com "www". vs. aqueles sem
Ter uma URL com e sem letras maiúsculas – é recomendável usar letras minúsculas o máximo possível.
URLs com e sem barras “/” no final do endereço da web
URLs para páginas contendo conteúdo copiado ou distribuído – a extração é ilegal, mas a distribuição de conteúdo é permitida se você vincular ao proprietário original. A distribuição se torna um problema se o Google escolher seu URL como a versão canônica em vez do site original. Isso é roubo de conteúdo em um grau mais alto e deve ser resolvido se isso acontecer.
URLs com e sem “index.html”.
Variantes de local de URL com o mesmo conteúdo
URLs para dispositivos móveis
Versões de URL redirecionando de sites de mídia social
Parâmetros de URL, independentemente de alterarem ou não o conteúdo da página, são adicionados ao final das URLs, como navegação facetada, códigos de rastreamento, IDs de sessão, classificação de conteúdo etc.
Qualquer página que mostre o mesmo conteúdo completo de outra página pode confundir o Google e fazer com que o canônico errado seja selecionado, incluindo a página principal do blog, páginas de categorias, páginas de tags, páginas paginadas ou páginas de feed.

Lembre-se, a consistência é vital quando se trata de preferência de site. Estruture seus URLs da maneira mais uniforme possível para minimizar problemas de conteúdo duplicado e canonização.

Saiba mais sobre canonização e conteúdo duplicado! Ligue para nós agora!

Hreflang

Rules | A Chalkboard With Letters In It Embora o Hreflang possa resolver problemas de duplicação em alguns sites, ele não funciona em sites internacionais. Por padrão, o Google buscará a versão correta do site e tentará mudar para uma versão local. No entanto, nem sempre funciona porque a versão local não é o site principal e pode causar problemas. Se isso acontecer, o que acontece é que os usuários acabam recebendo páginas de sites destinadas a usuários de um país diferente. Como o sistema do Google não está configurado para resolver isso adequadamente, os proprietários de sites são incentivados a publicar páginas em vários idiomas, por exemplo, com conteúdo pelo menos ligeiramente diferente (mesmo que o conteúdo seja uma tradução simples).

Para sites JavaScript, geralmente aqueles criados em modelos de shell de aplicativo, o código que aparece primeiro nas páginas pode ser lido de maneira muito semelhante a outras páginas e até mesmo a códigos em vários sites. Por causa disso, às vezes as páginas podem ser canonizadas como parte de outros grupos de páginas (ou seja, outros sites) ou para outras páginas no mesmo nível de domínio.

Lembre-se de que o Google usa algoritmos e provavelmente executa a detecção de duplicatas em ciclos automáticos. Isso pode ser parte do problema. Se o Google marca as páginas como duplicadas quando vê o código e não as rastreia totalmente, é possível que não consiga trocá-las corretamente porque parece outra página com base no conteúdo HTML. Isso significa que haverá um atraso na renderização da página porque ela já foi marcada como duplicada. Como seus especialistas em marca branca, podemos ajudar com nossos serviços de SEO e publicidade digital de marca branca.