Pagination – Elemen Penting dari Pengindeksan Mesin Pencari
Diterbitkan: 2017-11-08Daftar Isi
Pedoman SEO tentang pagination, misalnya kategori toko online atau artikel blog, adalah topik yang berulang dan ada beberapa pendekatan untuk itu. Kami akan membahas cara mengatasi pagination untuk membantu perayap web memproses konten dengan lebih mudah.
Apa itu paginasi?
Pagination hanyalah membagi sumber daya tertentu di situs web menjadi beberapa halaman. Contoh paling sederhana adalah kategori di sebagian besar toko online di mana setelah mendaftar sejumlah produk tertentu, pengguna dapat pergi ke bagian selanjutnya dari daftar produk. Cara lain untuk mempresentasikan produk dalam suatu kategori adalah pagination gulir tak terbatas di mana ketika pengguna menggulir ke bawah, produk baru dan baru ditampilkan. Hal yang sama untuk blog. Secara umum, tidak masalah sumber daya situs web mana yang dibagi menjadi beberapa bagian, ini lebih tentang bagaimana Anda melakukannya dan bagaimana Anda memberi tahu Googlebot tentang konten yang mengikuti.
Biarkan perayap web melakukan apa yang mereka lakukan
Salah satu kesalahan dasar yang dilakukan saat membuat paginasi adalah menggunakan tag kanonik pada halaman paginasi pertama. Dan meskipun dibenarkan dalam satu situasi, biasanya dilakukan secara tidak benar.
Jika, misalnya, kategori produk dibagi menjadi beberapa halaman, itu berarti bahwa halaman dasar mencakup sejumlah produk tertentu, halaman kedua berisi kelompok produk lain, dan seterusnya, hingga halaman pagination terakhir.
Halaman pagination adalah sebagai berikut:
https://website.com/ product-category/page-2
https://website.com/ product-category/page-3
https://website.com/product-category/page-4
dll.
oleh karena itu, tidak masuk akal untuk menggunakan tautan kanonik seperti itu:
<link rel="canonical" href="https://website.com/product-category" />
karena fakta bahwa itu adalah bagian lebih lanjut dari produk dari kategori tertentu, halaman 2,3,4, dll. bukan duplikat dari halaman utama (kecuali jika tidak demikian, maka menggunakan tautan kanonik adalah wajar) .
Secara alami, Anda dapat memberikan tautan kanonik, tetapi untuk diri mereka sendiri . Dalam kasus seperti itu, masukkan berikut ini di halaman https://website.com/product-category/ :
<link rel="canonical" href="https://website.com/product-category" />
dan berikut ini di halaman https://website.com/product-category/page-2:
<link rel="canonical" href="https://website.com/product-category/page-2" />
Halaman dengan semua konten
Ada pengecualian – halaman dasar dengan semua konten , juga dibagi menjadi beberapa sub-halaman dengan konten lebih sedikit. Dalam situasi seperti itu, masuk akal untuk menggunakan tautan kanonik. Ini adalah praktik yang sering digunakan dalam artikel yang cukup panjang dengan banyak konten.
Jadi, halaman-halaman berikut:
https://website.com/product-category/page-1
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
digabungkan menjadi satu urutan logis sebenarnya akan mencakup semua konten pada halaman dasar https://website.com/product-category/ yang ingin Anda gunakan untuk pengindeksan mesin pencari.
Halaman pagination pertama yang malang ini…
Namun kesalahan lain adalah menduplikasi halaman dasar kategori https://website.com/product-category/ dengan halaman pagination pertama https://website.com/product-category/page-1
Jika halaman dasar berisi konten yang sama dengan /halaman-1, maka tidak ada gunanya membuat duplikat – sistem manajemen konten tertentu biasanya menghasilkan (di samping halaman dasar)halaman pagination pertama yang dimulai dengan /halaman-1; dalam kasus seperti itu , alamatnya misalnya harus diarahkan ke halaman dasar menggunakan Redirect 301 , dan dalam kode Anda harus memberikan tautan bukan ke https://website.com/product-category/page-1 melainkan ke https://website. com/kategori-produk/
Jika tidak, Anda akan menghadapi masalah pengalihan internal, sehingga membuang anggaran perayapan Googlebot untuk merayapi situs web tertentu. Dengan kata lain, tidak ada gunanya mengarahkan ulang dengan tautan internal menggunakan Redirect 301 ketika Anda dapat menautkan langsung ke halaman arahan menggunakan kode status HTTP 200.
Atribut rel=“berikutnya”andrel=“sebelumnya”
Jika Anda memutuskan untuk membuat paginasi sebagai berikut:
https://website.com/product-category/
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
maka Anda dapat menunjukkan hubungan antara halaman individual ke crawler. Menyediakan tautan yang relevan dengan atribut rel di bagian <head>menyoroti halaman individual dari suatu urutan.
Pada halaman (dasar) pertama , letakkan yang berikut ini:
<link rel="next" href="https://website.com/product-category/page-2">
sebagai halaman lain yang berisi bagian dari sumber daya yang sama.
Di halaman berikutnya , yaitu https://website.com/product-category/page-2, masukkan yang berikut ini:
<link rel="prev" href="https://website.com/product-category/"> <link rel="next" href="https://website.com/product-category/page-3">
Pindah, di halaman ketiga, yaitu https://website.com/product-category/page-3:
<link rel="prev" href="https://website.com/product-category/page/page-2"> <link rel="next" href="https://website.com/product-category/page-4">
Dengan asumsi bahwa /page-4 adalah yang terakhir dalam urutan pagination , letakkan di sana yang berikut:
<link rel="prev" href="https://website.com/product-category/page-3">
Ini adalah kombinasi link yang paling sering digunakan dalam heading dengan atribut “rel next/prev”. Terkadang ada atribut yang ditambahkan ke tautan “<a href=" dalam kode (misalnya di bawah daftar), meskipun lebih baik menempatkannya di bagian<head> –semakin cepat perayap mendapatkan petunjuk di mana sisa sumber daya berada , lebih baik.
Anda harus ingat bahwa tautan dengan atribut “rel next/prev” bukanlah arahan mutlak , artinya tautan tersebut dapat, tetapi tidak harus, dipertimbangkan saat merayapi situs web. Selain itu, ada baiknya menggunakan jalur absolut ke halaman berikutnya, meskipun pedoman Google mengatakan bahwa "nilai dapat berupa jalur absolut dan jalur relatif." Namun, dalam hal halaman dengan parameter dalam URL, misalnya parameter pengurutan, parameter tersebut juga harus diletakkan di tautan “rel next/prev”–misalnya, halaman berikut:
https://website.com/product-category/page-3&sort=desc
akan menyertakan tautan berikut di bagian <head>:
<link rel="prev" href="https://website.com/product-category/page-2&sort=desc"> <link rel="next" href="https://website.com/product-category/page-4&sort=desc">
tetapi tag kanonik hanya menunjuk ke dirinya sendiri (tanpa parameter pengurutan dalam urutan menurun):
<link rel="canonical" href="https://website.com/product-category/page-3"/>
Mengindeks atau tidak mengindeks?
Masalah lain yang dihadapi saat membuat paginasi adalah penyalahgunaan meta-tag robot. Google mengklaim bahwa setiap halaman harus dianggap sebagai urutan logis yang akan menghasilkan mempertimbangkan atribut tautan mereka dan dalam banyak kasus akan membantu pengguna menampilkan halaman pertama.
Sangat sering terjadi bahwa halaman pagination individual, meskipun terhubung satu sama lain dengan tautan dengan atribut "rel next/prev", ada di indeks mesin pencari. Jika Anda memiliki masalah dengan itu, sebaiknya gunakan yang berikut ini:
<meta name="robots" content="noindex, follow" />
pada halaman berikutnya, yaitu pada /halaman-2 dan lebih tinggi. Perayap web akan merayapi tautan hingga halaman terakhir yang diberi halaman, tetapi tidak akan mengindeksnya.
Jadi bagaimana dengan kanonik?
Jelas mengikuti dari diskusi dengan John Mueller (https://plus.google.com/+JohnELincoln/posts/TCJHwdZHdQc) bahwa Anda tidak boleh menggabungkan tag meta 'tanpa indeks' dengan kanonik yang menunjuk ke URL yang dapat diindeks. Oleh karena itu, dalam kasus ini, jika tautan kanonik pada halaman pagination mengarah ke dirinya sendiri, tag meta 'tidak ada indeks' tidak boleh diletakkan dan sebaliknya.
Saya tidak melihat ada masalah dengan perayapan halaman berhalaman dengan tautan kanonik ke halaman itu sendiri dan tag meta 'tanpa indeks'; namun, Google ingin memutuskan sendiri apa yang akan diindeks dan apa yang tidak diindeks, jadi mungkin kita harus membiarkan Google melakukannya.
Pagination dan peta situs XML situs web
Berikut adalah kasus yang menarik: Anda sebaiknya tidak memasukkan tautan pagination di sitemap.xml, tetapi hanya alamat dasar, misalnya, kategori atau artikel utama dengan semua konten. Pada prinsipnya, dalam peta situs XML harus dimasukkan alamat-alamat yang ingin Anda indeks, jadi jika Anda tidak peduli dengan pengindeksan pagination, jangan sertakan URL di sana ke /page-2 dan yang lebih tinggi. Tentu saja, jika Anda memblokirnya dengan tag meta robot 'tanpa indeks', itu bahkan lebih sederhana – jangan berikan mereka.
Halaman pagination sebagai parameter
Jika Anda ingin mendukung pengindeksan produk/artikel dari halaman paginasi terakhir, berikan perayap web akses tak terbatas ke halaman kategori lain setelah kategori dasar. Sering kali halaman individual memiliki parameter “ ?page= ” atau “ ?p= ” dan dapat keliru diblokir di robots.txt bersama dengan parameter lainnya.
Hal ini mirip untuk parameter URL di Google Search Console . Patut ditunjukkan kepada Googlebot bahwa parameter tersebut bertanggung jawab untuk membagi sumber daya ke dalam halaman dan membiarkan bot memutuskan.
Pagination dan deskripsi kategori
Praktik yang sering diikuti adalah memperluas konten kategori, misalnya di toko online. Sering terjadi bahwa deskripsi tambahan ditampilkan di semua URL pagination dalam bentuk yang tidak berubah. Jika semua halaman diperlakukan sebagai urutan logis dan digabungkan menjadi satu dengan atribut “rel next/prev”, maka tampaknya tidak perlu menduplikasi teks yang sama pada /page-2, /page-3, dll.
Ini serupa sejauh menyangkut produk yang terdaftar: setiap halaman berikutnya menampilkan serangkaian produk baru, dan pengguna tidak ingin membaca deskripsi kategori yang sama sepanjang waktu di setiap halaman atau melihat produk yang sama lebih jauh di dalam kategori . Namun ada pertanyaan – siapa yang membaca deskripsi kategori? Googlebot mungkin melakukannya, jadi jangan memberi makan dengan duplikat.
Apakah Anda memerlukan pagination jika Anda menggunakan gulir tak terbatas?
Ternyata pagination adalah opsi yang layak juga dalam solusi 'gulir tak terbatas', di mana dengan menggulir ke bawah daftar produk/artikel dalam suatu kategori, sumber daya baru akan ditampilkan. John Mueller (http://scrollsample.appspot.com/items) memberikan contoh yang masuk akal: saat menggulir daftar, parameter baru yang menunjuk ke halaman berikutnya ditambahkan ke URL.
http://scrollsample.appspot.com/items?page=2
http://scrollsample.appspot.com/items?page=3
dan sebagainya dan sebagainya.
Jelas, di sini digunakan tautan dengan atribut "rel next/prev" dan disediakan tautan kanonik untuk dirinya sendiri; misalnya di http://scrollsample.appspot.com/items?page=5, adalah sebagai berikut:
<link rel="canonical" href="/items?page=5" /> <link rel="next" href="/items?page=6"/> <link rel="prev" href="/items?page=4"/>
Pagination sebagai elemen dari strategi pengindeksan
Keputusan untuk menerapkan solusi pagination tertentu adalah milik Anda. Contoh di atas bukanlah pilihan yang sempurna dalam setiap situasi karena Anda mungkin mengalami kesulitan teknis, masalah CMS atau hanya bertentangan dengan strategi pengindeksan yang diadopsi. Namun, ada baiknya mengoptimalkan pagination sedemikian rupa sehingga setidaknya tidak menghentikan Googlebot merayapi situs web, serta mendorong pengindeksan halaman produk/artikel terkubur yang tidak mudah diakses selama satu kunjungan.