Kanonikalisasi dan Konten Duplikat

Diterbitkan: 2023-05-13

Canonicalization and Duplicate Content | A Full Of Colorful Jewels

Kebanyakan orang memiliki beberapa versi URL yang mengarah ke versi situs web mereka yang terpisah namun serupa. Ada beberapa alasan untuk ini. Pertama, pemilik situs dapat menguji elemen yang berbeda atau melacak lalu lintas dari tempat lain, seperti situs media sosial.

Beberapa pertanyaan muncul dari ini. Pertama, versi situs web mana yang diindeks dan menjadi yang ditampilkan Google di halaman hasil untuk dilihat oleh pencari? Apa yang dilihat Google saat menentukan versi mana yang utama atau "kanonik" yang berperingkat di SERP? Apakah pemilik situs akan dihukum karena memiliki halaman konten duplikat ini?

Proses ini disebut kanonikalisasi, normalisasi, atau standardisasi, dan kami akan menjawab pertanyaan ini untuk Anda hari ini dan memberi Anda konsep kanonikalisasi yang lebih tepat. Kami akan mendalami dasar-dasarnya, sinyal apa yang dilihat Google, dan melihat contoh skenario di mana beberapa versi situs dan konten duplikat digunakan. Ini hanya informasi penting, jadi silakan berkonsultasi dengan layanan SEO label putih jika Anda memerlukan informasi lebih lanjut atau bantuan terkait masalah kanonikalisasi.

Ayo lompat!

Mencari Ahli SEO White Label? Hubungi Kami Sekarang!

Tag Kanonis

The Canonical Tag | An Arrow Pointing To A WebsIte Tag kanonis adalah kode yang dapat Anda masukkan ke bagian “<head>” pada kode halaman atau header HTTP. Ini memberi tahu mesin telusur bahwa versi URL Anda ini adalah versi yang ingin Anda peringkatkan – versi yang ditampilkan Google kepada penelusur. Saat mesin telusur merayapi situs web dan menemukan konten duplikat atau serupa, termasuk tag ini, ini menjelaskan bahwa satu versi URL adalah versi yang Anda pilih untuk diindeks.

Seperti inilah tampilannya:

<link rel=”canonical” https://www.yourwebsitehere.com />

(Pastikan kode dimasukkan dan ditutup dengan benar.)

Namun, perlu dicatat bahwa ini hanyalah salah satu dari sinyal lain yang diperiksa Google. Google melihat beberapa faktor, dan tag kanonis bahkan mungkin diabaikan demi sinyal yang berbeda.

Sinyal kanonikalisasi

Jadi bagaimana Google menentukan URL mana yang merupakan versi "kanonik"?

John Mueller dari Google menjelaskan bahwa ada dua pedoman umum saat memilih URL kanonis:

  1. Preferensi situs – apa yang dikatakan situs kepada Google yang diinginkannya menjadi URL kanonis
  2. Preferensi pengguna – URL apa yang ditentukan Google lebih bermanfaat bagi pencari

Hal-hal yang dilihat Google terkait preferensi situs:

  • Tag kanonis (tautan rel kanonis)
  • URL mana yang ada di file peta situs
  • Tautan internal
  • Pengalihan
  • URL HTTPS
  • URL yang terlihat lebih baik/lebih bersih

Mueller mengatakan mereka mempertimbangkan semua elemen ini dan memilih yang kanonis berdasarkan URL mana yang paling baik menggabungkan hal-hal ini. Dia juga menyarankan pemilik situs bahwa jika mereka lebih suka URL apa yang akan ditampilkan kepada penelusur, mereka harus menerapkan preferensi ini secara konsisten di seluruh situs web mereka. Sekali lagi, SEO lokal label putih sangat membantu jika Anda memiliki sumber daya terbatas di area ini.

Faktor lain dalam proses kanonikalisasi termasuk duplikat, tautan eksternal, dan Hreflang.

Google melihat beberapa faktor, dan tag kanonis bahkan mungkin diabaikan demi sinyal yang berbeda. Klik Untuk Menge-Tweet

Konten Duplikat

Duplicate Content | A Laptop That Has An Image Of A Spaceship Konten duplikat atau sangat mirip mungkin ada karena berbagai alasan, disengaja atau tidak, dan dapat menyebabkan banyak masalah saat memberi peringkat. Kanonikalisasi dapat mengurangi masalah ini. Meskipun duplikat konten tidak akan memberi Anda penalti, itu tidak berarti itu sepenuhnya tanpa konsekuensi.

Terutama, duplikat konten dapat menunda halaman situs yang tepat untuk muncul di halaman hasil. Misalnya, jika Anda memiliki dua peringkat halaman yang serupa untuk kata kunci yang tepat, mereka dapat bersaing, atau akan membutuhkan waktu Google untuk menentukan mana yang akan ditempatkan di SERP. Bahkan ketika Google menyiasatinya, itu mungkin tidak menampilkan versi yang Anda sukai atau versi yang Anda upayakan lebih keras. Google semakin baik dalam mengidentifikasi halaman mana yang menawarkan pengalaman pengguna terbaik. Tetap saja, konten yang berharga terkadang terkubur di bawah duplikat yang berlebihan seperti jarum di tumpukan tusuk gigi – serupa dalam bentuk tetapi tidak pada intinya. Anda dapat menyederhanakan proses ini melalui praktik kanonikalisasi.

Aturan Kanonikalisasi Duplikat Google

Dalam hal URL, Google akan sering memilih versi URL yang lebih bersih dan pendek daripada versi yang lebih panjang dan menyertakan parameter. Selain itu, Google sering kali lebih memilih HTTPS daripada versi HTTP situs.

Saat Google menemukan konten duplikat di halaman, Google akan memilih versi kanonis untuk diindeks. Ini akan menjadi versi yang ditentukan untuk menjadi yang terbaik. Semua halaman yang diidentifikasi sebagai duplikat akan membentuk sekelompok halaman. Sinyal dikirim ke halaman di dalam kluster itu dan bertindak sebagai konsolidator yang menunjuk ke kanonis yang dipilih. Perhatikan bahwa kanonis yang ditentukan Google masih dapat berubah seiring waktu bergantung pada peringkat Google dan faktor pengindeksan.

Berikut adalah beberapa contoh kasus yang dianggap duplikat konten pada halaman atau bahkan masalah kanonikalisasi:

  • URL dengan “www.” vs mereka yang tidak
  • Memiliki URL dengan dan tanpa huruf kapital – disarankan untuk menggunakan huruf kecil sebanyak mungkin.
  • URL dengan dan tanpa garis miring “/” di akhir alamat web
  • URL untuk halaman yang berisi konten salinan atau sindikasi – penggalian adalah ilegal, tetapi sindikasi konten diizinkan jika Anda menautkan ke pemilik aslinya. Sindikasi menjadi masalah jika Google memilih URL Anda sebagai versi kanonis daripada situs aslinya. Ini adalah pencurian konten ke tingkat yang lebih tinggi dan harus diselesaikan jika ini terjadi.
  • URL dengan dan tanpa "index.html".
  • Varian lokasi URL berisi konten yang sama
  • URL untuk perangkat seluler
  • Versi URL dialihkan dari situs media sosial
  • Parameter URL, apakah mengubah konten halaman atau tidak, ditambahkan di akhir URL, seperti navigasi segi, kode pelacakan, ID sesi, pengurutan konten, dll.
  • Halaman apa pun yang menampilkan konten lengkap yang sama dengan halaman lain dapat membingungkan Google dan menyebabkan pemilihan kanonis yang salah, termasuk halaman utama blog, halaman kategori, halaman tag, halaman bernomor halaman, atau halaman umpan.

Ingat, konsistensi sangat penting dalam hal preferensi situs. Susun URL Anda serata mungkin untuk meminimalkan masalah duplikat konten dan kanonikalisasi.

Pelajari Lebih Lanjut Tentang Kanonikalisasi dan Konten Duplikat! Hubungi kami sekarang!

Hreflang

Rules | A Chalkboard With Letters In It Meskipun Hreflang dapat mengatasi masalah duplikasi di beberapa situs, namun tidak berfungsi di situs internasional. Secara default, Google akan menggunakan versi situs web yang benar dan mencoba beralih ke versi lokal. Namun, itu tidak selalu berhasil karena versi lokal bukanlah situs utama dan dapat menyebabkan masalah. Jika ya, yang terjadi adalah pengguna akhirnya disuguhi halaman situs web yang dimaksudkan untuk pengguna di negara lain. Karena sistem Google tidak disiapkan untuk menyelesaikan masalah ini dengan benar, pemilik situs web didorong untuk menerbitkan halaman dalam berbagai bahasa, misalnya, dengan konten yang sedikit berbeda (walaupun kontennya adalah terjemahan sederhana).

Untuk situs JavaScript, biasanya yang dibuat dengan model shell aplikasi, kode yang muncul pertama kali di halaman dapat terbaca sangat mirip dengan halaman lain dan bahkan kode di berbagai situs web. Karena itu, halaman terkadang dapat dikanonikalisasi sebagai bagian dari kelompok halaman lain (yaitu, situs web lain) atau ke halaman lain di tingkat domain yang sama.

Ingatlah bahwa Google menggunakan algoritme dan kemungkinan besar menjalankan deteksi duplikat pada siklus otomatis. Ini bisa menjadi bagian dari masalah. Jika Google memberi tag pada laman sebagai duplikat saat melihat kode dan tidak merayapinya sepenuhnya, mungkin laman tidak dapat menukarnya dengan benar karena tampak seperti laman lain berdasarkan konten HTML. Ini berarti akan ada keterlambatan dalam merender halaman karena sudah ditandai sebagai duplikat. Sebagai ahli label putih Anda, kami dapat membantu dengan layanan iklan digital dan SEO label putih kami.