Canonicalización y contenido duplicado
Publicado: 2023-05-13La mayoría de las personas tienen múltiples versiones de una URL que dirigen a versiones separadas pero similares de su sitio web. Hay un par de razones para esto. En primer lugar, el propietario del sitio puede realizar pruebas divididas de diferentes elementos o realizar un seguimiento del tráfico de otros lugares, como sitios de redes sociales.
Algunas preguntas surgen de esto. Primero, ¿qué versiones de sitios web se indexan y se convierten en las que Google muestra en sus páginas de resultados para que las vean los buscadores? ¿Qué observa Google al determinar qué versión es la principal o "canónica" que se clasifica en los SERP? ¿Se penalizará a los propietarios de sitios por tener estas páginas de contenido duplicado?
Este proceso se llama canonicalización, normalización o estandarización, y hoy responderemos estas preguntas y le daremos un concepto más preciso de canonicalización. Nos sumergiremos en los conceptos básicos, qué señales observa Google y veremos escenarios de ejemplo en los que se utilizan múltiples versiones del sitio y contenido duplicado. Esta es solo información esencial, así que consulte los servicios de SEO de marca blanca si necesita más información o ayuda con problemas de canonicalización.
¡Saltamos!
La etiqueta canónica
Una etiqueta canónica es un código que puede ingresar en la sección "<head>" del código de su página o en el encabezado HTTP. Esto informa a los motores de búsqueda que esta versión de su URL es la que desea clasificar, la que Google muestra a los buscadores. Cuando los motores de búsqueda rastrean sitios web y encuentran contenido duplicado o similar, incluidas estas etiquetas, queda claro que una versión de URL es la que prefiere que se indexe.
Esto es lo que parece:
<enlace rel=”canonical” https://www.yourwebsitehere.com />
(Asegúrese de que el código esté ingresado y cerrado correctamente).
Sin embargo, vale la pena señalar que esta es solo una de las otras señales que verifica Google. Google analiza varios factores, y la etiqueta canónica puede incluso pasarse por alto en favor de una señal diferente.
Señales de canonicalización
Entonces, ¿cómo determina Google qué URL es la versión "canónica"?
John Mueller de Google explica que hay dos pautas generales al elegir la URL canónica:
- Preferencia del sitio: lo que el sitio le dice a Google que quiere que sea la URL canónica
- Preferencia del usuario: qué URL determina Google que es más beneficiosa para el buscador
Las cosas que Google analiza con respecto a la preferencia del sitio:
- Etiqueta canónica (enlace rel canonical)
- Qué URL está en el archivo del mapa del sitio
- Enlace interno
- Redirecciones
- URL HTTPS
- URL que se ven mejor/más limpias
Mueller dice que tienen en cuenta todos estos elementos y eligen el canónico en función de qué URL incorpora mejor estas cosas. También aconseja a los propietarios de sitios que, si prefieren qué URL mostrar a los buscadores, deben aplicar estas preferencias de forma coherente en todos sus sitios web. Nuevamente, el SEO local de marca blanca es útil si tiene recursos limitados en esta área.
Otros factores en el proceso de canonicalización incluyen duplicados, enlaces externos y Hreflang.
Google analiza varios factores, y la etiqueta canónica puede incluso pasarse por alto en favor de una señal diferente. Haz clic para twittearContenido duplicado
Puede existir contenido duplicado o muy similar por varias razones, intencionales o no, y puede causar muchos problemas al clasificar. La canonicalización puede mitigar estos problemas. Si bien el contenido duplicado no le otorgará una penalización per se, no significa que no tenga consecuencias.
Principalmente, el contenido duplicado podría retrasar la aparición de las páginas correctas del sitio en las páginas de resultados. Por ejemplo, si tiene dos páginas similares clasificadas para las palabras clave exactas, podrían competir, o le tomará tiempo a Google determinar cuál colocar en los SERP. Incluso cuando Google lo hace, es posible que no muestre el que prefieres o la versión en la que pones más esfuerzo. Google está mejorando en la identificación de las páginas que ofrecen la mejor experiencia de usuario. Aún así, el contenido valioso a veces puede quedar enterrado bajo duplicados excesivos como una aguja en una pila de palillos de dientes: similar en forma pero no en esencia. Puede simplificar este proceso a través de prácticas de canonicalización.
Reglas de canonización de duplicados de Google
En términos de URL, Google a menudo elige una versión de URL más limpia y corta en lugar de una que es más larga e incluye parámetros. Además, Google a menudo preferirá HTTPS a la versión HTTP de un sitio.
Cuando Google encuentra contenido duplicado en una página, elegirá una versión canónica para indexar. Esta será la versión que determine que es la mejor. Todas las páginas que identifica como duplicadas formarán un grupo de páginas. Las señales se envían a las páginas dentro de ese grupo y actúan como un consolidador que apunta a la canónica elegida. Tenga en cuenta que el canónico que determina Google aún puede cambiar con el tiempo según la clasificación de Google y los factores de indexación.
Los siguientes son algunos ejemplos de casos que se consideran contenido duplicado en páginas o incluso problemas de canonicalización:
- URL con "www". contra aquellos sin
- Tener una URL con y sin mayúsculas: se recomienda usar minúsculas tanto como sea posible.
- URL con y sin barras inclinadas finales "/" al final de la dirección web
- URL para páginas que contienen contenido extraído o sindicado: el raspado es ilegal, pero la sindicación de contenido está permitida si se vincula con el propietario original. La sindicación se convierte en un problema si Google elige su URL como la versión canónica sobre el sitio original. Esto es robo de contenido en un grado mayor y debe resolverse si esto sucede.
- URL con y sin "index.html".
- Variantes de ubicación de URL que contienen el mismo contenido
- URL para dispositivos móviles
- Versiones de URL que redireccionan desde sitios de redes sociales
- Los parámetros de URL, ya sea que cambien el contenido de la página o no, se agregan al final de las URL, como navegación por facetas, códigos de seguimiento, ID de sesión, clasificación de contenido, etc.
- Cualquier página que muestre el mismo contenido completo que otra página puede confundir a Google y hacer que se seleccione el canonical incorrecto, incluida la página principal del blog, las páginas de categorías, las páginas de etiquetas, las páginas paginadas o las páginas de fuentes.
Recuerde, la consistencia es vital cuando se trata de la preferencia del sitio. Estructure sus URL de la manera más uniforme posible para minimizar el contenido duplicado y los problemas de canonicalización.
Hreflang
Aunque Hreflang puede resolver problemas de duplicación en algunos sitios, no funciona en sitios internacionales. De forma predeterminada, Google buscará la versión correcta del sitio web e intentará cambiar a una versión local. Sin embargo, no siempre funciona porque la versión local no es el sitio líder y puede causar problemas. Si es así, lo que sucede es que los usuarios terminan recibiendo páginas de sitios web que están destinadas a usuarios en un país diferente. Debido a que el sistema de Google no está configurado para resolver esto correctamente, se recomienda a los propietarios de sitios web que publiquen páginas en varios idiomas, por ejemplo, con contenido al menos ligeramente diferente (incluso si el contenido es una traducción simple).
Para los sitios de JavaScript, por lo general los creados en modelos de shell de aplicaciones, el código que aparece primero en las páginas puede leerse de manera muy similar a otras páginas e incluso codificar en varios sitios web. Debido a esto, las páginas a veces pueden canonicalizarse como parte de otros grupos de páginas (es decir, otros sitios web) o en otras páginas en el mismo nivel de dominio.
Recuerde que Google usa algoritmos y lo más probable es que ejecute la detección de duplicados en ciclos automáticos. Esto puede ser parte del problema. Si Google etiqueta las páginas como duplicadas cuando ve el código y no las rastrea por completo, es posible que no pueda intercambiarlas correctamente porque parece otra página según el contenido HTML. Esto significa que habrá un retraso en la presentación de la página porque ya se ha etiquetado como duplicada. Como sus expertos en marca blanca, podemos ayudarlo con nuestros servicios de SEO y publicidad digital de marca blanca.