Paginacja – kluczowy element indeksowania w wyszukiwarkach

Opublikowany: 2017-11-08

Spis treści

    Wytyczne SEO dotyczące paginacji, np. kategorii sklepów internetowych czy artykułów na blogach, są tematem powracającym i podejść do tego tematu jest kilka. Omówimy, jak radzić sobie z paginacją, aby ułatwić robotom internetowym przetwarzanie treści.

    Co to jest paginacja?

    Paginacja to po prostu podzielenie określonego zasobu w witrynie na strony. Najprostszym przykładem mogą być kategorie w większości sklepów internetowych, gdzie po wpisaniu określonej liczby produktów użytkownik może przejść do kolejnej części listy produktów. Innym sposobem na prezentację produktów w ramach kategorii jest nieskończona paginacja przewijania, w której, gdy użytkownik przewija w dół, wyświetlane są nowe i nowe produkty. To samo dotyczy blogów. Generalnie nie ma znaczenia, który zasób witryny jest podzielony na części, chodzi raczej o to, jak to robisz i jak powiadamiasz Googlebota o kolejnych treściach.

    Pozwól robotom indeksującym robić to, co robią

    Jednym z podstawowych błędów popełnianych podczas paginacji jest używanie znaczników kanonicznych na pierwszej stronie paginacji. I choć w jednej sytuacji jest to uzasadnione, to zazwyczaj robi się to niepoprawnie.

    Jeśli np. kategoria produktowa jest podzielona na kilka stron, oznacza to, że strona bazowa zawiera określoną liczbę produktów, druga strona zawiera inną grupę produktów i tak dalej, aż do ostatniej paginacji.

    Strony paginacji są następujące:

    https://website.com/ product-category/page-2
    https://website.com/ product-category/page-3
    https://website.com/product-category/page-4

    itp.

    dlatego nie ma sensu używać takich linków kanonicznych:

     <link rel="canonical" href="https://website.com/product-category" />

    ze względu na to, że jest to dalsza część produktów z danej kategorii, strony 2,3,4 itp. nie są duplikatami strony głównej (chyba, że ​​tak nie jest, to użycie linku kanonicznego jest uzasadnione) .

    Oczywiście możesz podać linki kanoniczne, ale do siebie . W takim przypadku wpisz na stronie https://website.com/product-category/ :

     <link rel="canonical" href="https://website.com/product-category" />

    oraz następujące na stronie https://website.com/product-category/page-2:

     <link rel="canonical" href="https://website.com/product-category/page-2" />

    Strona z całą zawartością

    Jest wyjątek – strona bazowa z całą zawartością , dodatkowo podzielona na kilka podstron o mniejszej zawartości. W takiej sytuacji sensowne jest skorzystanie z linku kanonicznego. Jest to praktyka stosowana często w dość długich artykułach z dużą ilością treści.

    Stąd następujące strony:

    https://website.com/product-category/page-1
    https://website.com/product-category/page-2
    https://website.com/product-category/page-3
    https://website.com/product-category/page-4

    połączone w jeden logiczny ciąg będzie w rzeczywistości zawierał całą zawartość strony bazowej https://website.com/product-category/, którą chcesz wykorzystać do indeksowania w wyszukiwarkach.

    Ta niefortunna pierwsza strona stronicowania…

    Kolejnym błędem jest zduplikowanie strony bazowej kategorii https://website.com/product-category/ z pierwszą stroną paginacji https://website.com/product-category/page-1

    Jeśli strona bazowa zawiera taką samą treść jak /strona-1, to nie ma sensu robić duplikatu – niektóre systemy zarządzania treścią zwykle generują (oprócz strony bazowej) pierwszą stronę paginacji rozpoczynającą się od /strona-1; w takim przypadku , adres powinien być np. przekierowany na stronę bazową za pomocą Redirect 301 , a w kodzie należy podać link nie do https://website.com/product-category/page-1 ale raczej do https://website. pl/kategoria-produktu/

    W przeciwnym razie napotkasz wewnętrzny problem z przekierowaniami, co spowoduje marnowanie budżetu Googlebota na indeksowanie danej witryny. Innymi słowy, nie ma sensu przekierowywać go za pomocą wewnętrznego linku za pomocą Redirect 301, gdy możesz linkować bezpośrednio do strony docelowej za pomocą kodu statusu HTTP 200.

    Atrybuty rel="next"andrel="prev"

    Jeśli zdecydujesz się na stronicowanie w następujący sposób:

    https://website.com/product-category/
    https://website.com/product-category/page-2
    https://website.com/product-category/page-3
    https://website.com/product-category/page-4

    następnie możesz wskazać robotowi indeksującemu relacje między poszczególnymi stronami. Podanie odpowiednich linków z atrybutami rel w sekcji <head> wyróżnia poszczególne strony sekwencji.

    Na pierwszej (podstawowej) stronie umieść następujące dane:

     <link rel="next" href="https://website.com/product-category/page-2">

    jako inna strona zawierająca część tego samego zasobu.

    Na następnej stronie , tj. https://website.com/product-category/page-2, wpisz:

     <link rel="prev" href="https://website.com/product-category/">
    <link rel="next" href="https://website.com/product-category/page-3">

    Idąc dalej, na trzeciej stronie, tj. https://website.com/product-category/page-3:

     <link rel="prev" href="https://website.com/product-category/page/page-2">
    <link rel="next" href="https://website.com/product-category/page-4">

    Zakładając, że /strona-4 jest ostatnią w kolejności stronicowania , umieść tam:

     <link rel="prev" href="https://website.com/product-category/page-3">

    Jest to najczęściej używana kombinacja linków w nagłówku z atrybutami „rel next/prev”. Czasami do linków „<a href=" w kodzie (np. pod listą) dodawane są atrybuty, choć lepiej umieścić je w sekcji<head> – im szybciej robot dostanie wskazówkę, gdzie znajduje się reszta zasobu , lepiej.

    Należy pamiętać, że linki z atrybutami „rel next/prev” nie są dyrektywami bezwzględnymi , tzn. mogą, ale nie muszą być brane pod uwagę podczas indeksowania witryny. Dodatkowo warto stosować ścieżki bezwzględne do kolejnych stron, choć wytyczne Google mówią, że „wartościami mogą być ścieżki bezwzględne i ścieżki względne”. Natomiast w przypadku strony z parametrami w adresie URL, np. parametry sortowania, należy je również umieścić w linkach „rel next/prev” – np. następująca strona:

    https://website.com/product-category/page-3&sort=desc

    będzie zawierać następujące linki w sekcji <head>:

     <link rel="prev" href="https://website.com/product-category/page-2&sort=desc">
    <link rel="next" href="https://website.com/product-category/page-4&sort=desc">

    ale znacznik kanoniczny wskazujący tylko na siebie (bez parametru sortowania w porządku malejącym):

     <link rel="canonical" href="https://website.com/product-category/page-3"/>

    Indeksować czy nie indeksować?

    Innym problemem napotykanym podczas stronicowania jest niewłaściwe używanie meta-tagów robotów. Google twierdziło, że poszczególne strony należy traktować jako logiczny ciąg, który spowoduje uwzględnienie atrybutów ich linków i w większości przypadków pomoże użytkownikowi wyświetlić pierwszą stronę.

    Bardzo często zdarza się, że poszczególne strony paginacji, mimo że są połączone ze sobą linkami z atrybutami „rel next/prev”, znajdują się w indeksie wyszukiwarki. Jeśli masz z tym problem, najlepiej będzie skorzystać z:

     <meta name="robots" content="noindex, śledź" />

    na kolejnych stronach, tj. na stronie /str.-2 i wyższych. Robot indeksujący będzie indeksować linki do ostatniej strony podzielonej na strony, ale nie będzie ich indeksować.

    A co z kanonikami?

    Z dyskusji z Johnem Muellerem (https://plus.google.com/+JohnELincoln/posts/TCJHwdZHdQc) jasno wynika, że ​​nie należy łączyć metatagów „bez indeksu” ze znakami kanonicznymi wskazującymi na indeksowalny adres URL. Dlatego w tym przypadku, jeśli link kanoniczny na stronie paginacji kieruje do samego siebie, metatagu „bez indeksu” nie należy umieszczać i odwrotnie.

    Nie zauważyłem żadnych problemów z indeksowaniem stron paginowanych z linkami kanonicznymi do samych stron i metatagiem „no index”; jednak Google chce sam decydować, co indeksować, a czego nie, więc może powinniśmy pozwolić Google to zrobić.

    Paginacja i strona internetowa Mapa witryny XML

    Oto ciekawy przypadek: raczej nie wpisujesz linków do stronicowania w sitemap.xml, a jedynie adres bazowy np. kategorii lub głównego artykułu z całą zawartością. W zasadzie w mapie witryny XML należy wpisać te adresy, które chcesz zaindeksować, więc jeśli nie zależy Ci na indeksowaniu paginacji, nie umieszczaj tam adresów URL do /page-2 i wyższych. Oczywiście, jeśli zablokujesz go metatagiem robots „bez indeksu”, jest to jeszcze prostsze – nie podawaj ich.

    Paginacja stron jako parametry

    Jeśli chcesz wesprzeć indeksowanie produktów/artykułów od ostatniej strony podzielonej na strony, zapewnij robotom indeksującym nieograniczony dostęp do stron innych kategorii poza kategorią bazową. Często zdarza się, że poszczególne strony mają parametry „ ?page= ” lub „ ?p= ” i mogą zostać przez pomyłkę zablokowane w pliku robots.txt wraz z resztą parametrów.

    Podobnie jest z parametrami adresu URL w Google Search Console . Warto pokazać Googlebotowi, że takie parametry odpowiadają za podział zasobów na strony i pozwolenie botowi na podjęcie decyzji.

    Paginacja i opisy kategorii

    Często stosowaną praktyką jest poszerzanie treści kategorii, np. w sklepach internetowych. Często zdarza się, że dodany opis jest wyświetlany pod wszystkimi adresami stronicowania w niezmienionej formie. Jeśli wszystkie strony są traktowane jako logiczny ciąg i połączone w całość za pomocą atrybutów „rel next/prev”, wówczas nie ma potrzeby powielania tego samego tekstu na /page-2, /page-3 itd.

    Podobnie jest z wymienionymi produktami: na każdej kolejnej stronie wyświetla się nowy zestaw produktów, a użytkownik nie chce czytać cały czas tego samego opisu kategorii na każdej stronie ani nie oglądać tych samych produktów dalej w obrębie kategorii . Pojawia się jednak pytanie – kto czyta opisy kategorii? Googlebot prawdopodobnie to robi, więc nie podawaj mu duplikatów.

    Czy potrzebujesz stronicowania, jeśli używasz nieskończonego zwoju?

    Okazuje się, że paginacja jest realną opcją także w rozwiązaniu „infinite scroll”, gdzie przewijając listę produktów/artykułów w ramach kategorii, wyświetlają się nowe zasoby. John Mueller (http://scrollsample.appspot.com/items) podał sensowny przykład: podczas przewijania listy do adresu URL dodawane są nowe parametry wskazujące na kolejne strony.

    http://scrollsample.appspot.com/items?page=2
    http://scrollsample.appspot.com/items?page=3

    i tak dalej i tak dalej.

    Oczywiście są tu używane linki z atrybutami „rel next/prev” i pod warunkiem, że jest to kanoniczny link do samego siebie; na przykład pod adresem http://scrollsample.appspot.com/items?page=5 wygląda to następująco:

     <link rel="canonical" href="/items?page=5" />
    <link rel="next" href="/items?page=6"/>
    <link rel="prev" href="/items?page=4"/>

    Uruchom Senuto teraz Zarejestruj się za darmo

    Paginacja jako element strategii indeksowania

    Decyzja o zastosowaniu konkretnego rozwiązania paginacji należy oczywiście do Ciebie. Powyższe przykłady nie są idealnym rozwiązaniem w każdej sytuacji, ponieważ możesz napotkać trudności techniczne, problemy z CMS lub po prostu jest to sprzeczne z przyjętą strategią indeksowania. Warto jednak zoptymalizować paginację do takiego stopnia, aby przynajmniej nie powstrzymać Googlebota przed indeksowaniem witryny, a także wspierać indeksowanie ukrytych stron produktów/artykułów, które nie są tak łatwo dostępne podczas jednej wizyty.

    Uruchom Senuto teraz Zarejestruj się za darmo