Importanța unui fișier Sitemap pe un site web

Publicat: 2019-12-03

Ultima actualizare pe 11 decembrie 2019

Motoarele de căutare folosesc crawling-ul web pentru a-și actualiza conținutul web prin indexarea conținutului web al altor site-uri. Un crawler web, cunoscut și sub numele de spider sau spiderbot, este un bot de internet care navighează sistematic pe World Wide Web pentru indexarea Web a adreselor URL ale paginilor. graphic of a spider bot

Ce face crawlerul web?

Crawlerele web copiază pagini pentru procesare de către motorul de căutare, care indexează paginile descărcate, astfel încât utilizatorii să poată căuta mai eficient. Crawlerele web pot descoperi de obicei majoritatea paginilor site-ului dvs. dacă sunt conectate corect. Cu toate acestea, prin utilizarea fișierelor sitemap, puteți îmbunătăți accesul cu crawlere a paginilor site-ului dvs.

Dacă site-ul dvs. este nou și are puține linkuri externe către acesta sau dacă site-ul folosește conținut media îmbogățit, crawlerele web accesează cu crawlere web-ul urmând linkuri de la o pagină la alta. Și mai rău, dacă site-ul dvs. este extins, cu o arhivă vastă de pagini de conținut care sunt izolate sau nu sunt bine legate între ele, crawlerele web ar putea trece cu vederea accesarea cu crawlere a unora dintre paginile dvs. noi sau actualizate recent. În consecință, motoarele de căutare ar putea să nu îți descopere paginile dacă niciun alt site nu trimite către ele. În oricare dintre cazurile de mai sus, un fișier de hartă site poate oferi informații suplimentare crawler-ului web pentru a se asigura că motoarele de căutare nu trec cu vederea unele dintre paginile site-ului dvs. web.


Acea! Compania oferă servicii de web design captivante și eficiente pentru agenții din întreaga lume. Aflați mai multe despre serviciile noastre de design web cu etichetă albă și despre cum vă putem ajuta pe dvs. și clienții dvs. să creați sau să-și îmbunătățească prezența pe web. Incepe astazi!


Ce este un fișier Sitemap și cum este structurat?

Un sitemap este un fișier de etichete XML care listează adrese URL pentru un site împreună cu metadate suplimentare despre fiecare adresă URL; cum ar fi când pagina a fost actualizată ultima dată, cât de des se schimbă de obicei și cât de importantă este (prioritatea) în raport cu alte adrese URL din site. Putem avea diferite fișiere de hartă de site care oferă informații despre paginile, videoclipurile, imaginile și alte fișiere de pe site-ul dvs. web și relațiile dintre acestea, astfel încât motoarele de căutare să poată accesa cu crawlere mai inteligent site-ul dvs. Harta site-ului îi spune crawler-ului care fișiere sunt importante pe site-ul dvs. și oferă, de asemenea, informații valoroase despre aceste fișiere. Crawlerele web care acceptă sitemaps preiau toate adresele URL din sitemap și învață despre acele adrese URL folosind metadatele asociate.

screenshot of a text file with sitemap code Un format de protocol de hartă de site constă din etichete XML. Harta site-ului trebuie să includă:

  • O deschidere <urlset> cu spațiul de nume (standard de protocol) în eticheta <urlset>.
    • O intrare de etichetă <url> de deschidere pentru fiecare adresă URL, ca etichetă XML părinte.
      • O etichetă <loc> ca intrare secundară a fiecărei etichete părinte <url> cu adresa URL a paginilor.
    • O etichetă de închidere </url>,
  • O etichetă de închidere </urlset>.

Mai jos este o ilustrare a unui protocol de bază de fișier de hartă site-ului și a structurii cu unele etichete opționale. Pentru mai multe informații despre definițiile etichetelor XML din protocolul sitemap, vizitați https://www.sitemaps.org/protocol.html.

screenshot of website code

Toate adresele URL enumerate în fișierul sitemap trebuie să se afle pe același domeniu ca și fișierul sitemap. De exemplu, dacă fișierul sitemap se află la https://www.mydomain.com/sitemap.xml, acesta nu poate include adrese URL de la https://subdomain.mydomain.com. Dacă fișierul sitemap se află la https://www.mydomain.com/myfolder/sitemap.xml, acesta nu poate include adrese URL de la https://www.mydomain.com. Protocolul fișierului sitemap trebuie generat folosind o metodă de codificare a caracterelor UTF-8. Este recomandat să plasați harta site-ului în directorul rădăcină al serverului dvs. HTML; adică puneți-l la https://www.mydomain.com/sitemap.xml

Sitemapurile nu trebuie să depășească 50 MB și pot conține maximum 50.000 de adrese URL. Aceste limite vă ajută să vă asigurați că serverul dvs. web nu se blochează deservind fișiere uriașe. Dacă site-ul dvs. conține mai mult de 50.000 de adrese URL sau sitemap-ul dvs. este mai mare de 50 MB, trebuie să creați mai multe fișiere sitemap și să utilizați un fișier index sitemap. Dacă site-ul dvs. este mic, dar intenționați să creșteți peste 50.000 de adrese URL sau o dimensiune a fișierului de 50 MB, este recomandat să începeți să utilizați fișierele index ale sitemap-urilor.


That! Company White Label Services


În eticheta <loc>, trebuie să includeți protocolul (de exemplu, HTTP sau HTTPS) al adresei URL a paginii dvs. De asemenea, trebuie să includeți o bară oblică finală în adresa URL dacă serverul dvs. web necesită una. De exemplu, http://www.mydomain.com/ este o adresă URL validă pentru un Sitemap, în timp ce www.mydomain.com nu este. Este important să enumerați o singură versiune a adresei URL a paginii dvs. în sitemapurile dvs. Aceasta înseamnă că enumerați numai adresele URL HTTPS sau numai adresele URL HTTP, dar nu ambele. Includerea mai multor versiuni ale adresei URL a paginilor poate duce la accesarea cu crawlere incompletă a site-ului dvs. de către motorul de căutare.

Două modalități obișnuite de a avea fișierul sitemap disponibil pentru motoarele de căutare este să îl trimiteți prin intermediul instrumentului de trimitere pentru motoarele de căutare sau prin inserarea unei linii precum Sitemap: https://www.mydomain.com/sitemap.xml , oriunde pe site-ul dvs. fișierul robots.txt, care specifică calea către fișierul sitemap. Un fișier robots.txt spune unui motor de căutare ce parte a site-ului dvs. nu doriți să includeți pentru indexare, iar harta site-ului le spune acestor motoare de căutare unde doriți să ajungă.

De ce este important un fișier sitemap?

graphic of a sitemap structure Nu există niciun dezavantaj pentru a avea un fișier de hartă de site și a avea unul vă poate îmbunătăți SEO, așa că este foarte recomandat să aveți unul pe site-urile dvs. web. Sitemap-urile sunt importante pentru SEO deoarece facilitează ca motoarele de căutare să găsească paginile site-ului dvs. Acest lucru este important deoarece un motor de căutare clasifică PAGINILE web, nu doar site-urile web. Vă puteți gândi la o hartă a site-ului ca un plan pentru casa dvs., în cazul în care fiecare pagină web este o cameră, astfel încât motorul de căutare poate găsi rapid și ușor toate camerele din casa dvs.

Există o varietate de trucuri și sfaturi SEO care vă vor ajuta să vă optimizați site-ul, iar unul dintre acestea este utilizarea fișierelor sitemap. Importanța fișierelor sitemaps uneori este foarte subestimată. Din nou, un sitemap este o hartă literală a site-ului dvs. Ele fac navigarea pe site-ul dvs. mai ușoară, iar atunci când păstrați un fișier de hartă site actualizat pentru site-ul dvs., acesta este potrivit nu numai pentru dvs., ci și pentru motoarele de căutare. Fișierele Sitemap reprezintă o modalitate esențială pentru ca un site să comunice cu un motor de căutare.

Cum va beneficia un site de pe urma unui fișier Sitemap?

Utilizarea unui fișier sitemap are atât de multe beneficii. Nu numai că oferă o hartă pentru a naviga pe site-ul dvs., dar oferă o mai bună vizibilitate motoarelor de căutare. Un fișier de hartă site oferă posibilitatea de a lega motoarele de căutare cu orice modificări aduse paginilor site-ului dvs. imediat după ce acestea au loc. Nu vă puteți aștepta ca motoarele de căutare să se grăbească să țină seama de modificările din paginile dvs., dar, fără îndoială, ele vor schimba modificările pe care le-ați făcut mai rapid decât atunci când un site web nu are un fișier de hartă site.

Când există un link către un site web și este trimis la motoarele de căutare, vă veți baza mai puțin pe linkuri externe atunci când motoarele de căutare aduc vizitatori pe site-ul dvs. Când aveți un fișier de hartă a site-ului și îl trimiteți la motoarele de căutare, vă bazați mai puțin pe link-uri externe care vor aduce motoarele de căutare pe site-ul dvs.

graphic of a sitemap structure in use

Fișierul sitemap chiar ajută la remedierea legăturilor interne slabe. De exemplu, dacă există link-uri rupte accidental sau pagini orfane la care nu se poate ajunge. Trebuie remarcat faptul că nu este o idee înțeleaptă să te bazezi pe o hartă a site-ului, mai degrabă decât să remediezi erorile. Trebuie să rețineți că utilizarea unui fișier de hartă site nu garantează că toate adresele URL din harta dvs. vor fi accesate cu crawlere și indexate, deoarece procesele motoarele de căutare se bazează pe algoritmi complexi pentru a programa accesarea cu crawlere. Cu toate acestea, în cele mai multe cazuri, site-ul dvs. web va beneficia de a avea un fișier de hartă site și nu veți fi niciodată penalizat pentru că aveți unul.

Autor: Arturo S.