Canonicalization และเนื้อหาที่ซ้ำกัน
เผยแพร่แล้ว: 2023-05-13คนส่วนใหญ่มี URL หลายเวอร์ชันที่นำไปยังเว็บไซต์ของตนแต่มีเวอร์ชันที่คล้ายกัน มีเหตุผลสองสามประการสำหรับเรื่องนี้ ขั้นแรก เจ้าของไซต์อาจแยกการทดสอบองค์ประกอบต่างๆ หรือติดตามการเข้าชมจากที่อื่น เช่น เว็บไซต์โซเชียลมีเดีย
คำถามสองสามข้อเกิดขึ้นจากสิ่งนี้ ประการแรก เว็บไซต์เวอร์ชันใดได้รับการจัดทำดัชนีและกลายเป็นเวอร์ชันที่ Google แสดงในหน้าผลลัพธ์ให้ผู้ค้นหาเห็น Google ดูอะไรเมื่อพิจารณาว่าเวอร์ชันใดเป็นเวอร์ชันหลักหรือ "บัญญัติ" ที่จัดอันดับใน SERP เจ้าของเว็บไซต์จะถูกลงโทษสำหรับการมีหน้าเนื้อหาที่ซ้ำกันเหล่านี้หรือไม่?
กระบวนการนี้เรียกว่าการทำให้เป็นรูปเป็นร่าง การทำให้เป็นปกติ หรือทำให้เป็นมาตรฐาน และเราจะตอบคำถามเหล่านี้ให้คุณในวันนี้และให้แนวคิดที่ชัดเจนยิ่งขึ้นเกี่ยวกับการทำให้เป็นมาตรฐาน เราจะเจาะลึกข้อมูลพื้นฐาน สัญญาณที่ Google พิจารณา และดูตัวอย่างสถานการณ์ที่มีการใช้ไซต์หลายเวอร์ชันและเนื้อหาที่ซ้ำกัน นี่เป็นข้อมูลที่จำเป็นเท่านั้น ดังนั้นโปรดปรึกษาบริการ SEO ของไวท์เลเบล หากคุณต้องการข้อมูลเพิ่มเติมหรือความช่วยเหลือเกี่ยวกับปัญหาการทำให้เป็นรูปเป็นร่าง
โดดเข้าไปเลย!
แท็ก Canonical
แท็ก Canonical คือโค้ดที่คุณสามารถป้อนลงในส่วน “<head>” ของโค้ดเพจหรือส่วนหัว HTTP ข้อมูลนี้แจ้งให้เครื่องมือค้นหาทราบว่า URL เวอร์ชันนี้เป็นเวอร์ชันที่คุณต้องการจัดอันดับ ซึ่งเป็นเวอร์ชันที่ Google แสดงต่อผู้ค้นหา เมื่อเครื่องมือค้นหารวบรวมข้อมูลเว็บไซต์และพบเนื้อหาที่ซ้ำกันหรือคล้ายกัน รวมถึงแท็กเหล่านี้ จะเป็นการชี้แจงว่า URL เวอร์ชันหนึ่งคือเวอร์ชันที่คุณต้องการให้จัดทำดัชนี
นี่คือลักษณะ:
<link rel=”canonical” https://www.yourwebsitehere.com />
(ตรวจสอบว่าใส่รหัสเข้าและปิดถูกต้อง)
อย่างไรก็ตาม เป็นที่น่าสังเกตว่านี่เป็นเพียงหนึ่งในสัญญาณอื่นๆ ที่ Google ตรวจสอบ Google พิจารณาปัจจัยหลายประการ และอาจมองข้ามแท็ก Canonical ด้วยซ้ำไปเพราะสัญญาณอื่นแทน
สัญญาณ Canonicalization
Google ทราบได้อย่างไรว่า URL ใดเป็นเวอร์ชัน "ตามรูปแบบบัญญัติ"
John Mueller จาก Google อธิบายว่ามีหลักเกณฑ์ทั่วไป 2 ข้อในการเลือก Canonical URL:
- การตั้งค่าไซต์ - สิ่งที่ไซต์บอก Google ว่าต้องการให้ URL ตามรูปแบบบัญญัติเป็นอย่างไร
- การตั้งค่าของผู้ใช้ – URL ใดที่ Google พิจารณาว่ามีประโยชน์มากกว่าสำหรับผู้ค้นหา
สิ่งที่ Google พิจารณาเกี่ยวกับการตั้งค่าไซต์:
- แท็ก Canonical (ลิงก์ rel บัญญัติ)
- URL ใดอยู่ในไฟล์แผนผังไซต์
- การเชื่อมโยงภายใน
- การเปลี่ยนเส้นทาง
- HTTPS URL
- URL ที่ดูดีขึ้น/สะอาดขึ้น
Mueller กล่าวว่าพวกเขาคำนึงถึงองค์ประกอบเหล่านี้ทั้งหมดและเลือกรูปแบบมาตรฐานตาม URL ที่รวมสิ่งเหล่านี้ได้ดีที่สุด นอกจากนี้ เขายังแนะนำเจ้าของไซต์ว่าหากพวกเขาต้องการให้ URL ใดแสดงแก่ผู้ค้นหา พวกเขาต้องใช้การตั้งค่าเหล่านี้อย่างสม่ำเสมอทั่วทั้งเว็บไซต์ของตน ย้ำอีกครั้งว่า SEO ท้องถิ่นแบบไวท์เลเบลจะมีประโยชน์หากคุณมีทรัพยากรจำกัดในด้านนี้
ปัจจัยอื่นๆ ในกระบวนการทำให้เป็นมาตรฐานรวมถึงสำเนา ลิงก์ภายนอก และ Hreflang
Google พิจารณาปัจจัยหลายประการ และอาจมองข้ามแท็ก Canonical ด้วยซ้ำไปเพราะสัญญาณอื่นแทน คลิกเพื่อทวีตเนื้อหาที่ซ้ำกัน
เนื้อหาที่ซ้ำกันหรือคล้ายกันมากอาจเกิดขึ้นได้จากหลายสาเหตุ ทั้งโดยเจตนาหรืออื่นๆ และอาจทำให้เกิดปัญหามากมายในการจัดอันดับ Canonicalization สามารถลดปัญหาเหล่านี้ได้ แม้ว่าเนื้อหาที่ซ้ำกันจะไม่ทำให้คุณได้รับโทษ แต่ก็ไม่ได้หมายความว่าจะไม่มีผลกระทบทั้งหมด
โดยหลักแล้ว เนื้อหาที่ซ้ำกันอาจทำให้หน้าเว็บไซต์ที่ถูกต้องแสดงบนหน้าผลลัพธ์ได้ล่าช้า ตัวอย่างเช่น หากคุณมีหน้าที่คล้ายกันสองหน้าที่จัดอันดับสำหรับคำหลักที่ตรงกัน หน้าเว็บเหล่านั้นอาจแข่งขันกัน หรือ Google ต้องใช้เวลาในการพิจารณาว่าจะวางหน้าใดใน SERP แม้ว่า Google จะเข้ามาใกล้ แต่ก็อาจไม่แสดงรุ่นที่คุณต้องการหรือรุ่นที่คุณทุ่มเทลงไป Google เก่งขึ้นเรื่อยๆ ในการระบุว่าหน้าใดให้ประสบการณ์ผู้ใช้ที่ดีที่สุด ถึงกระนั้น บางครั้งเนื้อหาอันมีค่าอาจถูกฝังอยู่ใต้สำเนาที่มากเกินไป เช่น เข็มในกองไม้จิ้มฟัน - รูปแบบคล้ายกันแต่ไม่มีสาระสำคัญ คุณสามารถลดความซับซ้อนของกระบวนการนี้ได้โดยผ่านหลักปฏิบัติในการทำให้เป็นมาตรฐาน
กฎ Canonicalization ที่ซ้ำกันของ Google
ในแง่ของ URL Google มักจะเลือก URL เวอร์ชันที่สั้นและสะอาดกว่ามากกว่า URL ที่ยาวกว่าและมีพารามิเตอร์ นอกจากนี้ Google มักจะชอบ HTTPS มากกว่าเวอร์ชัน HTTP ของเว็บไซต์
เมื่อ Google พบเนื้อหาที่ซ้ำกันในหน้าหนึ่งๆ Google จะเลือกเวอร์ชันตามรูปแบบบัญญัติเพื่อจัดทำดัชนี นี่จะเป็นรุ่นที่มันตัดสินว่าดีที่สุด เพจทั้งหมดที่ระบุว่าซ้ำกันจะสร้างกลุ่มของเพจ สัญญาณจะถูกส่งไปยังเพจภายในคลัสเตอร์นั้นและทำหน้าที่เป็นตัวรวมที่ชี้ไปที่บัญญัติที่เลือก โปรดทราบว่า Canonical ที่ Google พิจารณายังคงสามารถเปลี่ยนแปลงได้เมื่อเวลาผ่านไป ทั้งนี้ขึ้นอยู่กับปัจจัยการจัดอันดับและการจัดทำดัชนีของ Google
ต่อไปนี้คือตัวอย่างบางกรณีที่ถือว่าเป็นเนื้อหาที่ซ้ำกันในหน้าต่างๆ หรือแม้กระทั่งปัญหาเกี่ยวกับการกำหนดรูปแบบบัญญัติ:
- URL ที่มี “www.” เทียบกับผู้ที่ไม่มี
- การมี URL ที่มีและไม่มีตัวพิมพ์ใหญ่ - ขอแนะนำให้ใช้ตัวพิมพ์เล็กให้มากที่สุด
- URL ที่มีและไม่มีเครื่องหมายทับ "/" ต่อท้ายที่อยู่เว็บ
- URL สำหรับหน้าที่มีเนื้อหาที่คัดลอกมาหรือคัดลอกมา การคัดลอกเป็นสิ่งผิดกฎหมาย แต่การเผยแพร่เนื้อหาจะได้รับอนุญาตหากคุณลิงก์ไปยังเจ้าของเดิม การเผยแพร่จะกลายเป็นปัญหาหาก Google เลือก URL ของคุณเป็นเวอร์ชันมาตรฐานเหนือไซต์ดั้งเดิม นี่คือการขโมยเนื้อหาในระดับที่สูงกว่า และต้องจัดการหากสิ่งนี้เกิดขึ้น
- URL ที่มีและไม่มี “index.html”
- รูปแบบตำแหน่ง URL ที่มีเนื้อหาเดียวกัน
- URL สำหรับอุปกรณ์พกพา
- เวอร์ชัน URL ที่เปลี่ยนเส้นทางจากไซต์โซเชียลมีเดีย
- พารามิเตอร์ของ URL ไม่ว่าจะเปลี่ยนแปลงเนื้อหาของหน้าหรือไม่ก็ตาม จะถูกเพิ่มที่ส่วนท้ายของ URL เช่น การนำทางแบบเหลี่ยม โค้ดติดตาม รหัสเซสชัน การเรียงลำดับเนื้อหา เป็นต้น
- หน้าใดๆ ที่แสดงเนื้อหาทั้งหมดเหมือนกันกับหน้าอื่นอาจทำให้ Google สับสนและทำให้เลือก Canonical ผิด รวมถึงหน้าหลักสำหรับบล็อก หน้าหมวดหมู่ หน้าแท็ก หน้าที่มีการแบ่งหน้า หรือหน้าฟีด
โปรดจำไว้ว่าความสอดคล้องเป็นสิ่งสำคัญเมื่อพูดถึงการตั้งค่าไซต์ จัดโครงสร้าง URL ของคุณให้เหมือนกันมากที่สุดเพื่อลดปัญหาเนื้อหาที่ซ้ำกันและการกำหนดรูปแบบบัญญัติให้เหลือน้อยที่สุด
ฮอฟลัง
แม้ว่า Hreflang สามารถแก้ปัญหาการทำซ้ำได้ในบางไซต์ แต่ไม่สามารถใช้ได้กับไซต์ต่างประเทศ ตามค่าเริ่มต้น Google จะใช้เวอร์ชันเว็บไซต์ที่ถูกต้องและพยายามเปลี่ยนเป็นเวอร์ชันท้องถิ่น อย่างไรก็ตาม มันไม่ได้ผลเสมอไปเพราะเวอร์ชันในเครื่องไม่ใช่ไซต์หลักและอาจทำให้เกิดปัญหาได้ หากเป็นเช่นนั้น สิ่งที่เกิดขึ้นก็คือผู้ใช้จะได้รับบริการหน้าเว็บไซต์ที่มีไว้สำหรับผู้ใช้ในประเทศอื่น เนื่องจากระบบของ Google ไม่ได้ตั้งค่าให้จัดเรียงสิ่งนี้อย่างเหมาะสม เจ้าของเว็บไซต์ควรเผยแพร่หน้าเว็บหลายภาษา เช่น อย่างน้อยก็มีเนื้อหาที่แตกต่างกันเล็กน้อย (แม้ว่าเนื้อหาจะเป็นการแปลอย่างง่ายก็ตาม)
สำหรับไซต์ JavaScript ซึ่งมักจะสร้างจากโมเดลเปลือกแอป โค้ดที่ปรากฏเป็นอันดับแรกในหน้าต่างๆ สามารถอ่านได้คล้ายกับหน้าอื่นๆ หรือแม้แต่โค้ดบนเว็บไซต์ต่างๆ ด้วยเหตุนี้ บางครั้งหน้าต่างๆ จะได้รับการทำให้เป็น Canonicalized โดยเป็นส่วนหนึ่งของกลุ่มหน้าอื่นๆ (เช่น เว็บไซต์อื่นๆ) หรือไปยังหน้าอื่นๆ ในระดับโดเมนเดียวกัน
โปรดจำไว้ว่า Google ใช้อัลกอริทึมและมักจะเรียกใช้การตรวจหารายการซ้ำในรอบอัตโนมัติ นี่อาจเป็นส่วนหนึ่งของปัญหา หาก Google ติดแท็กหน้าเว็บว่าซ้ำกันเมื่อเห็นโค้ดและไม่ได้รวบรวมข้อมูลทั้งหมด อาจเป็นไปได้ว่าจะไม่สามารถสลับหน้าได้อย่างถูกต้องเนื่องจากดูเหมือนหน้าอื่นที่ใช้เนื้อหา HTML ซึ่งหมายความว่าจะมีความล่าช้าในการแสดงผลหน้า เนื่องจากหน้าดังกล่าวถูกแท็กว่าซ้ำกัน ในฐานะผู้เชี่ยวชาญไวท์เลเบลของคุณ เราสามารถช่วยเหลือเกี่ยวกับบริการโฆษณาดิจิทัลและ SEO ไวท์เลเบลของเราได้