Sitemaps XML: tot ce trebuie să știți pentru SEO
Publicat: 2019-01-25Când ați folosit ultima dată o hartă?
Nici nu-mi amintesc să fiu sincer.
Dar hărțile site -ului — hărțile site-urilor sunt la fel de relevante ca întotdeauna când vine vorba de SEO.
Ani de zile am trimis pur și simplu hărți de site la Google Search Console pentru că am auzit că este cea mai bună practică, am bifat caseta și am trecut mai departe.
Nu am înțeles pe deplin de ce am făcut asta și eram plin de concepții greșite.
Dar sitemap-urile XML nu sunt doar o casetă care trebuie bifată.
Sitemap-urile sunt un instrument puternic și, în calitate de SEO, este esențial să înțelegeți fundalul lor, dezavantajele și cele mai bune practici.
Sitemaps XML: tot ce trebuie să știți pentru SEO
Ce este un Sitemap XML?
Mai simplu spus, un sitemap XML este un director sau ghid care conține cele mai importante pagini ale unui site web. Acestea sunt menite să ajute crawlerii să vă înțeleagă site-ul web și modul în care este structurat.
O hartă a site-ului este un fișier XML (Extensible Markup Language) care este ușor de digerat de motoarele de căutare. Arata cam asa:
Aceasta este doar o singură adresă URL și prezintă toate etichetele disponibile conform sitemaps.org, dar singura etichetă necesară este locația - adresa URL a paginii.
Yoast, un instrument SEO popular pentru site-urile WordPress, generează hărți de site care arată astfel:
După cum sa menționat, funcția principală a unui sitemap este de a ajuta motoarele de căutare să înțeleagă site-urile web. Sitemap-urile XML fac acest lucru indicând trei lucruri importante:
- Cele mai importante pagini de pe un site web.
- Structura și arhitectura site-ului.
- Cât de recent au fost actualizate paginile.
2 Concepții greșite comune despre sitemapurile XML
Înainte de a aborda modul de generare a unui sitemap, ce să includem și ce să excludem, să abordăm două concepții greșite foarte frecvente.
1. Fiecare pagină ar trebui inclusă
După cum sa menționat mai sus, o hartă a site-ului ar trebui să prezinte cele mai importante pagini ale unui site web. Teoria este că numai paginile site-ului dvs. pe care doriți să le găsiți pe motoarele de căutare ar trebui să fie incluse în harta site-ului dvs.
Dacă este posibil, ar trebui să faceți tot posibilul pentru a împărți paginile site-ului dvs. în două categorii: cele pe care doriți să ajungă utilizatorii din motoarele de căutare și cele pe care nu le faceți.
Paginile pe care doriți să le accesați din motoarele de căutare nu trebuie să fie blocate de robots.txt și trebuie incluse în harta dvs. XML de site.
Paginile pe care nu doriți să le accesați din motoarele de căutare ar trebui să fie blocate de robots.txt și nu ar trebui să fie incluse în harta site-ului dvs. XML.
2. Fiecare pagină inclusă va fi indexată
Ai citit bine:
Doar pentru că ați inclus o adresă URL în harta site-ului dvs. nu garantează că este indexată.
Și invers, chiar dacă ați exclus o adresă URL din harta site-ului dvs., crawlerele motoarelor de căutare pot indexa în continuare pagina.
Sitemap-urile XML sunt doar o recomandare pentru crawlere. Este important să rețineți că site-ul dvs. trimite o mulțime de alte semnale către crawlere. Dacă într-adevăr nu doriți ca o pagină să fie indexată, vă recomandăm cu siguranță o interdicție robots.txt.
Probabil cea mai încercată și adevărată modalitate de a vedea ce pagini indexează într-adevăr Google este să efectueze un site:căutare.
De asemenea, puteți efectua o căutare pentru o anumită adresă URL pentru a vedea dacă poate fi sau nu indexată.
Cele mai bune practici XML Sitemap
Deci avem o idee bună despre ce este un sitemap XML și ne-am uitat la câteva concepții greșite comune ale sitemap-ului. Să ne aprofundăm în cele mai bune practici.
1. Utilizați un instrument pentru a vă genera Sitemap
Primul pas pentru utilizarea corectă a sitemap-urilor este să generați unul. Din păcate, ele nu sunt create doar magic. Aveți câteva opțiuni pentru a face acest lucru:
Yoast SEO
Dacă site-ul dvs. a fost construit pe WordPress, aceasta este o idee simplă. Yoast oferă un plugin gratuit pentru a vă ajuta cu optimizarea în pagină, indexare, canonice și generarea de hărți de site.
Dacă nu aveți deja pluginul Yoast SEO instalat pe site-ul dvs., iată ce trebuie să faceți:
A. În tabloul de bord de administrare WordPress, navigați la Pluginuri și faceți clic pe „Adăugați nou”.
B. În bara de căutare, căutați „Yoast”.
C. Faceți clic pe „Instalare acum”, apoi pe „Activare”.
D. Navigați la [domeniul-dvs..com]/sitemap.xml. Voila !
xml-sitemaps.com
Acesta este un alt instrument excelent pentru generarea de hărți de site XML, mai ales dacă nu utilizați WordPress. Iată ce trebuie făcut:
A. Navigați la xml-sitemaps.com și introduceți domeniul dvs. în bara de intrare.
B. Permiteți site-ului să acceseze cu crawlere domeniul dvs. (ar putea dura aproximativ un minut). Descărcați harta site-ului dvs.
C. Folosind un FTP sau un manager de fișiere, încărcați domeniul în folderul rădăcină al site-ului dvs. web.
Dacă aveți un computer Windows, vă recomandăm Filezilla. Iată câteva instrucțiuni pentru încărcarea fișierelor cu Filezilla. Dacă aveți un computer Mac, vă recomandăm Transmit. Iată câteva instrucțiuni pentru utilizarea Transmit.
2. Trimiteți la Google Search Console
Acum că aveți un sitemap, poate vă întrebați ce să faceți cu el.
Primul pas este să îl trimiteți la Google Search Console. Acest lucru va ajuta Google să acceseze cu crawlere și să indexeze site-ul dvs., dar așa cum am menționat, acest lucru nu garantează că fiecare pagină inclusă va fi indexată sau că fiecare pagină exclusă va fi exclusă din index.
Iată ce trebuie făcut:
A. Navigați la Google Search Console și selectați „Începe acum”. Dacă aveți deja un cont G Suite, conectați-vă aici. Dacă nu, iată un ghid pentru configurare.
Odată conectat, ar trebui să fiți direcționat către un ecran care arată astfel:
B. Introduceți domeniul dvs. și faceți clic pe „Adăugați proprietate”.
Google necesită verificarea faptului că sunteți proprietarul site-ului. Dacă ați configurat Google Analytics, se va face automat pentru dvs. Dacă nu, există alte câteva opțiuni pentru verificare.
C. Navigați la hărțile site-ului.
D. Introduceți adresa URL a sitemapului dvs. și faceți clic pe „Trimiteți”.
Și ești gata! Acordați-i lui Google ceva timp pentru a citi harta site-ului și a verifica periodic pentru a vedea dacă Google a întâmpinat erori.
3. Prioritizează paginile de cea mai înaltă calitate
Când vine vorba de clasare, s-ar părea că Google nu ia în considerare doar valoarea paginii în cauză, ci și calitatea generală a unui site web.
Să presupunem că site-ul dvs. are 500 de pagini, dar numai 10 sunt pagini care conțin conținut fantastic care este util utilizatorilor. Restul sunt fie postări de blog vechi și irelevante, fie pagini „utile” (autentificări, coșuri de cumpărături, locuri pentru a recupera parolele pierdute etc.).
Este foarte posibil ca Google să ia acest lucru ca pe un semnal că marea majoritate a site-ului dvs. web conține conținut de calitate scăzută, slăbindu-vă astfel șansele de a vă clasifica bine paginile cele mai importante.
Prin urmare, țineți cont de acest lucru când decideți ce pagini doriți să fie incluse în harta site-ului dvs. După cum am menționat mai sus, este destul de simplu:
- Includeți și indexați paginile pe care doriți să le găsiți prin motoarele de căutare
- Excludeți și nu indexați paginile pe care nu ați dori să le găsiți prin motoarele de căutare
4. Folosiți Noindex
Vorbind despre includerea și excluderea paginilor, este foarte important să fim consecvenți. Includerea unei pagini pe harta site-ului dvs., dar instruirea motoarelor de căutare să nu o acceseze cu crawlere nu este o idee bună.
Deci, dacă nu doriți ca o pagină să fie inclusă în harta dvs. de site, lăsați-o oprită și asigurați-vă că nu este indexată.
Aveți câteva opțiuni când vine vorba de a vă asigura că motoarele de căutare nu accesează cu crawlere site-ul dvs. Puteți utiliza metaroboți (instrucțiuni în <head> unei pagini) sau fișierul robots.txt (un singur fișier care conține instrucțiuni pentru crawler).
Meta-roboții sunt probabil un pariu sigur pentru o postare mai veche de blog sau o pagină de utilitate, în timp ce o interdicție robots.txt ar avea mai mult sens dacă doriți să minimizați bugetul de accesare cu crawlere.
5. Luați în considerare Bugetul Crawl
Vorbind despre bugetul de accesare cu crawlere, este important să țineți cont de acest lucru atunci când vă gândiți ce pagini să includeți sau să excludeți în sitemap-ul dvs. XML.
Mai simplu spus, un buget de accesare cu crawlere are de-a face cu ceea ce Google se referă ca „limită a ratei de accesare cu crawlere”. Cu alte cuvinte, Googlebots nu pot accesa cu crawlere fiecare pagină de pe web oricând doresc. Există limite atât pentru serverele Google, cât și pentru serverele site-ului dvs.
Dacă aveți un site foarte mare (vorbim de câteva mii de adrese URL), trebuie să fiți mult mai atent când alegeți ce pagini să includeți decât majoritatea site-urilor web de pe web care au mult mai puține pagini.
Aflați mai multe despre bugetele de accesare cu crawlere și cele mai bune practici direct de la Google.
Și aici îl aveți - tot ce trebuie să știți despre sitemap-urile XML, cum să le generați, să le trimiteți și să le utilizați pentru a vă îmbunătăți SEO.
După ce ați urmat toți acești pași, asigurați-vă că urmăriți îndeaproape performanța site-ului dvs. cu Monitor Backlinks . Acesta vă va urmări cuvintele cheie pentru dvs., astfel încât să știți întotdeauna care dintre paginile dvs. sunt accesate cu crawlere și se clasează pe Google.
Puteți alege o încercare gratuită de 30 de zile aici pentru a o învârti.
Acum mergeți și ajutați Google să vă acceseze mai bine site-ul cu crawlere!