Paginación: un elemento crucial de la indexación de motores de búsqueda
Publicado: 2017-11-08Tabla de contenido
Las pautas de SEO sobre paginación, por ejemplo, de categorías de tiendas en línea o artículos de blog, son un tema recurrente y hay algunos enfoques al respecto. Vamos a discutir cómo abordar la paginación para ayudar a los rastreadores web a procesar el contenido más fácilmente.
¿Qué es la paginación?
La paginación es simplemente dividir un recurso específico en un sitio web en páginas. El ejemplo más simple pueden ser las categorías en la mayoría de las tiendas en línea donde, después de listar un número específico de productos, el usuario puede pasar a la siguiente parte de la lista de productos. Otra forma de presentar productos dentro de una categoría es la paginación de desplazamiento infinito donde cuando el usuario se desplaza hacia abajo, se muestran productos nuevos y nuevos. Es lo mismo para los blogs. En general, no importa qué recurso de un sitio web se divide en partes, se trata más de cómo lo haces y cómo notificas a Googlebot sobre el contenido que sigue.
Deje que los rastreadores web hagan lo que hacen
Uno de los errores básicos que se cometen al paginar es usar etiquetas canónicas en la primera página de paginación. Y aunque está justificado en una situación, por lo general se hace de forma incorrecta.
Si, por ejemplo, una categoría de productos se divide en pocas páginas, significa que la página base incluye un número específico de productos, la segunda página incluye otro grupo de productos, y así sucesivamente, hasta la última página de paginación.
Las páginas de paginación son las siguientes:
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
etc.
por lo tanto, no tiene mucho sentido usar tales enlaces canónicos:
<enlace rel="canonical" href="https://website.com/categoría-producto" />
debido al hecho de que es una parte más de los productos de una categoría determinada, las páginas 2,3,4, etc. no son duplicados de la página principal (a menos que no sea el caso, entonces es razonable usar un enlace canónico) .
Naturalmente, puede proporcionar enlaces canónicos, pero a sí mismos . En tal caso, ingrese lo siguiente en la página https://website.com/product-category/ :
<enlace rel="canonical" href="https://website.com/categoría-producto" />
y lo siguiente en la página https://website.com/product-category/page-2:
<enlace rel="canonical" href="https://website.com/product-category/page-2" />
Una página con todo el contenido.
Hay una excepción: una página base con todo el contenido , además dividida en algunas subpáginas con menos contenido. En tal situación, tiene sentido utilizar un enlace canónico. Es una práctica que se usa a menudo en artículos bastante largos y con mucho contenido.
Así, las siguientes páginas:
https://website.com/product-category/page-1
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
combinados en una sola secuencia lógica, de hecho, incluirán todo el contenido en la página base https://website.com/product-category/ que desea utilizar para la indexación del motor de búsqueda.
Esta desafortunada primera página de paginación...
Otro error más es duplicar la página base de la categoría https://website.com/product-category/ con la primera página de paginación https://website.com/product-category/page-1
Si la página base incluye el mismo contenido que /página-1, entonces no tiene sentido hacer un duplicado; ciertos sistemas de administración de contenido normalmente generan (además de una página base) la primera página de paginación que comienza con /página-1; en tal caso , la dirección debe, por ejemplo, ser redirigida a la página base usando Redirect 301 , y en el código debe proporcionar un enlace no a https://website.com/product-category/page-1 sino a https://website. com/categoría-producto/
De lo contrario, encontrará un problema de redirección interna, desperdiciando así el presupuesto de rastreo de Googlebot para rastrear un sitio web determinado. En otras palabras, no sirve de nada redirigirlo con un enlace interno utilizando Redirect 301 cuando puede vincular directamente a la página de destino utilizando el código de estado HTTP 200.
Los atributos rel=“next”andrel=“prev”
Si decide paginar de la siguiente manera:
https://website.com/product-category/
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
luego puede indicar las relaciones entre páginas individuales a un rastreador. Proporcionar enlaces relevantes con atributos rel en la sección <head> resalta las páginas individuales de una secuencia.
En la primera página (base) , ponga lo siguiente:
<enlace rel="siguiente" href="https://website.com/product-category/page-2">
como otra página que contiene una parte del mismo recurso.
En la página siguiente , es decir, https://website.com/product-category/page-2, coloque lo siguiente:
<enlace rel="prev" href="https://website.com/product-category/"> <enlace rel="siguiente" href="https://website.com/product-category/page-3">
Continuando, en la tercera página, es decir, https://website.com/product-category/page-3:
<enlace rel="prev" href="https://website.com/product-category/page/page-2"> <enlace rel="siguiente" href="https://website.com/product-category/page-4">
Suponiendo que /page-4 es el último en la secuencia de paginación , coloque lo siguiente:
<enlace rel="prev" href="https://website.com/product-category/page-3">
Es la combinación de enlaces más utilizada en un encabezado con atributos “rel next/prev”. A veces se agregan atributos a los enlaces “<a href=” en el código (por ejemplo, debajo de la lista), aunque es mejor ponerlos en la sección <head> , cuanto antes el rastreador tenga una idea de dónde está el resto del recurso. , el mejor.
Debe recordar que los enlaces con los atributos "rel next/prev" no son directivas absolutas , es decir, pueden, pero no tienen que, tenerse en cuenta al rastrear un sitio web. Además, vale la pena usar rutas absolutas a las páginas posteriores, aunque las pautas de Google dicen que "los valores pueden ser rutas absolutas y rutas relativas". Sin embargo, en el caso de una página con parámetros en una URL, por ejemplo, parámetros de clasificación, también deben colocarse en los enlaces "rel siguiente/anterior", por ejemplo, la siguiente página:
https://website.com/product-category/page-3&sort=desc
incluirá los siguientes enlaces en la sección <head>:
<enlace rel="prev" href="https://website.com/product-category/page-2&sort=desc"> <enlace rel="siguiente" href="https://website.com/product-category/page-4&sort=desc">
pero una etiqueta canónica que apunta solo a sí misma (sin el parámetro de clasificación en orden descendente):
<enlace rel="canonical" href="https://website.com/product-category/page-3"/>
¿Indexar o no indexar?
Otro problema al que se enfrenta la paginación es el uso indebido de metaetiquetas de robots. Google afirmó que las páginas individuales se deben considerar como una secuencia lógica que resultará en tener en cuenta los atributos de sus enlaces y, en la mayoría de los casos, ayudará al usuario a mostrar la primera página.
Es muy frecuente que las páginas de paginación individuales, a pesar de estar conectadas entre sí con enlaces con atributos "rel siguiente/anterior", estén en el índice del motor de búsqueda. Si tienes algún problema con eso, lo mejor será usar lo siguiente:
<meta name="robots" content="noindex, seguir" />
en las páginas subsiguientes, es decir, en /página-2 y posteriores. Un rastreador web rastreará los enlaces hasta la última página paginada, pero no los indexará.
Entonces, ¿qué pasa con los canónicos?
De la discusión con John Mueller (https://plus.google.com/+JohnELincoln/posts/TCJHwdZHdQc) se desprende claramente que no debe combinar metaetiquetas 'sin índice' con etiquetas canónicas que apunten a una URL indexable. Por lo tanto, en este caso, si un enlace canónico en una página de paginación se dirige a sí mismo, no se debe colocar una metaetiqueta 'sin índice' y viceversa.
No noté ningún problema con el rastreo de páginas paginadas con enlaces canónicos a las propias páginas y la metaetiqueta 'sin índice'; sin embargo, Google quiere decidir por sí mismo qué indexar y qué no indexar, así que tal vez deberíamos dejar que Google lo haga.
Paginación y mapa del sitio XML del sitio web
Aquí hay un caso interesante: prefiere no ingresar enlaces de paginación en un sitemap.xml, sino solo la dirección base de, por ejemplo, una categoría o el artículo principal con todo el contenido. En principio, en un mapa del sitio XML se deben ingresar las direcciones que desea indexar, por lo que si no le importa la indexación de la paginación, no incluya las URL a /page-2 y superiores. Naturalmente, si lo bloquea con una metaetiqueta de robots 'sin índice', es aún más simple: no los proporcione.
Páginas de paginación como parámetros
Si desea respaldar la indexación de productos/artículos desde la última página paginada, proporcione a los rastreadores web acceso ilimitado a páginas de otras categorías más allá de la categoría base. Suele ocurrir que las páginas individuales tienen parámetros “ ?page= ” o “ ?p= ” y pueden bloquearse por error en robots.txt junto con el resto de los parámetros.
Es similar para los parámetros de URL en Google Search Console . Vale la pena mostrarle a Googlebot que tales parámetros son los encargados de dividir los recursos en páginas y dejar que el bot decida.
Paginación y descripciones de categorías.
Una práctica seguida con frecuencia es ampliar el contenido de la categoría, por ejemplo, en las tiendas en línea. A menudo sucede que se muestra una descripción agregada en todas las URL de paginación sin cambios. Si todas las páginas se tratan como una secuencia lógica y se combinan en un todo mediante los atributos "rel siguiente/anterior", parece innecesario duplicar el mismo texto en /página-2, /página-3, etc.
Es similar en lo que se refiere a los productos listados: cada página subsiguiente muestra un nuevo conjunto de productos, y el usuario no quiere leer la misma descripción de categoría todo el tiempo en todas y cada una de las páginas ni mirar los mismos productos dentro de la categoría. . Sin embargo, hay una pregunta: ¿quién lee las descripciones de las categorías? Googlebot probablemente lo haga, así que no lo alimente con duplicados.
¿Necesita paginación si usa un desplazamiento infinito?
Resulta que la paginación es una opción viable también en la solución de 'desplazamiento infinito', donde al desplazarse hacia abajo en la lista de productos/artículos dentro de una categoría, se muestran nuevos recursos. John Mueller (http://scrollsample.appspot.com/items) proporcionó un ejemplo sensato: al desplazarse por la lista, se agregan a la URL nuevos parámetros que apuntan a las páginas siguientes.
http://scrollsample.appspot.com/items?page=2
http://scrollsample.appspot.com/items?page=3
y así sucesivamente y así sucesivamente.
Obviamente, aquí se utilizan enlaces con atributos "rel next/prev" y se proporciona un enlace canónico a sí mismo; por ejemplo, en http://scrollsample.appspot.com/items?page=5, es el siguiente:
<enlace rel="canonical" href="/elementos?página=5" /> <enlace rel="siguiente" href="/elementos?página=6"/> <enlace rel="prev" href="/elementos?página=4"/>
La paginación como elemento de una estrategia de indexación
La decisión de aplicar una solución de paginación en particular es naturalmente suya. Los ejemplos anteriores no son opciones perfectas en todas las situaciones porque puede encontrar dificultades técnicas, problemas de CMS o simplemente es contrario a una estrategia de indexación adoptada. Sin embargo, vale la pena optimizar la paginación hasta el punto de que al menos no impida que Googlebot rastree el sitio web, así como fomentar la indexación de páginas de productos/artículos enterrados que no son tan fácilmente accesibles durante una sola visita.