L'importanza di un file Sitemap su un sito web
Pubblicato: 2019-12-03Ultimo aggiornamento 11 dicembre 2019
I motori di ricerca utilizzano la scansione web per aggiornare i propri contenuti web indicizzando i contenuti web di altri siti. Un web crawler, noto anche come spider o spiderbot, è un bot Internet che esplora sistematicamente il World Wide Web per l'indicizzazione Web dell'URL delle pagine.
Cosa fa il web crawler?
I web crawler copiano le pagine per l'elaborazione da parte del motore di ricerca, che indicizza le pagine scaricate in modo che gli utenti possano cercare in modo più efficiente. I web crawler di solito possono scoprire la maggior parte delle pagine del tuo sito se sono collegati correttamente. Tuttavia, con l'uso dei file della mappa del sito, puoi migliorare la scansione delle pagine del tuo sito web.
Se il tuo sito è nuovo e ha pochi link esterni ad esso, o se il sito utilizza contenuti rich media, i web crawler eseguono la scansione del web seguendo i link da una pagina all'altra. Peggio ancora, se il tuo sito è esteso con un vasto archivio di pagine di contenuto che sono isolate o non ben collegate tra loro, i web crawler potrebbero trascurare la scansione di alcune delle tue pagine nuove o aggiornate di recente. Di conseguenza, i motori di ricerca potrebbero non scoprire le tue pagine se nessun altro sito si collega ad esse. In uno dei casi precedenti, un file della mappa del sito può fornire informazioni aggiuntive al web crawler per garantire che i motori di ricerca non trascurino alcune delle pagine del tuo sito web.
Quella! L'azienda fornisce servizi di web design accattivanti ed efficaci per le agenzie di tutto il mondo. Scopri di più sui nostri servizi di web design White Label e su come possiamo aiutare te e i tuoi clienti a creare o migliorare la loro presenza sul web. Inizia oggi!
Che cos'è un file Sitemap e come è strutturato?
Una mappa del sito è un file di tag XML che elenca gli URL di un sito insieme a metadati aggiuntivi su ciascun URL; come quando la pagina è stata aggiornata l'ultima volta, quanto spesso cambia di solito e quanto è importante (priorità) rispetto ad altri URL nel sito. Possiamo avere diversi file della mappa del sito che forniscono informazioni su pagine, video, immagini e altri file sul tuo sito Web e le relazioni tra di loro, in modo che i motori di ricerca possano eseguire la scansione del tuo sito Web in modo più intelligente. La mappa del sito indica al crawler quali file sono importanti nel tuo sito Web e fornisce anche informazioni preziose su questi file. I web crawler che supportano le mappe del sito raccolgono tutti gli URL nella mappa del sito e vengono a conoscenza di tali URL utilizzando i metadati associati.
Un formato di protocollo della mappa del sito è costituito da tag XML. La mappa del sito deve includere:
- Un'apertura <urlset> con lo spazio dei nomi (standard di protocollo) all'interno del tag <urlset>.
- Una voce di tag <url> di apertura per ogni URL, come tag XML principale.
- Un tag <loc> come voce figlio di ogni tag padre <url> con l'URL delle pagine.
- Un tag di chiusura </url>,
- Una voce di tag <url> di apertura per ogni URL, come tag XML principale.
- Un tag di chiusura </urlset>.
Di seguito è illustrata una struttura e un protocollo di base del file della mappa del sito con alcuni tag opzionali. Per ulteriori informazioni sulle definizioni dei tag XML nel protocollo Sitemap, visitare https://www.sitemaps.org/protocol.html.
Tutti gli URL elencati nel file della mappa del sito devono risiedere nello stesso dominio del file della mappa del sito. Ad esempio, se il file della mappa del sito si trova in https://www.mydomain.com/sitemap.xml, non può includere URL da https://subdomain.mydomain.com. Se il file della mappa del sito si trova in https://www.mydomain.com/myfolder/sitemap.xml, non può includere URL da https://www.mydomain.com. Il protocollo del file della mappa del sito deve essere generato utilizzando un metodo di codifica dei caratteri UTF-8. Si consiglia vivamente di posizionare la mappa del sito nella directory principale del server HTML; cioè, mettilo su https://www.mydomain.com/sitemap.xml
Le mappe del sito non devono superare i 50 MB e possono contenere un massimo di 50.000 URL. Questi limiti aiutano a garantire che il tuo server web non si impantani nel servire file di grandi dimensioni. Se il tuo sito contiene più di 50.000 URL o la tua mappa del sito è più grande di 50 MB, devi creare più file della mappa del sito e utilizzare un file di indice della mappa del sito. Se il tuo sito è piccolo ma prevedi di crescere oltre i 50.000 URL o una dimensione del file di 50 MB, ti consigliamo di iniziare a utilizzare i file di indice della mappa del sito.
Nel tag <loc>, devi includere il protocollo (ad esempio, HTTP o HTTPS) dell'URL della tua pagina. Devi anche includere una barra finale nel tuo URL se il tuo server web lo richiede. Ad esempio, http://www.miodominio.com/ è un URL valido per una Sitemap, mentre www.miodominio.com non lo è. È importante elencare solo una versione dell'URL della tua pagina nelle tue Sitemap. Ciò significa che elenca solo gli URL HTTPS o solo gli URL HTTP ma non entrambi. L'inclusione di più versioni dell'URL delle pagine può comportare una scansione incompleta del tuo sito da parte del motore di ricerca.
Due modi comuni per rendere disponibile il file della mappa del sito ai motori di ricerca è inviarlo tramite lo strumento di invio dei motori di ricerca o inserendo una riga come Sitemap: https://www.mydomain.com/sitemap.xml , ovunque nel tuo sito web robots.txt, che specifica il percorso del file della mappa del sito. Un file robots.txt dice a un motore di ricerca quale parte del tuo sito web non vuoi includere per l'indicizzazione e la mappa del sito dice a questi motori di ricerca dove vuoi che vadano.
Perché un file della mappa del sito è importante?
Non c'è alcun aspetto negativo nell'avere un file della mappa del sito e averne uno può migliorare la tua SEO, quindi è altamente raccomandato averne uno nei tuoi siti web. Le Sitemap sono importanti per la SEO perché rendono più facile per i motori di ricerca trovare le pagine del tuo sito. Questo è importante perché un motore di ricerca classifica le PAGINE web, non solo i siti web. Puoi pensare a una mappa del sito come a un progetto per la tua casa, dove ogni pagina web è una stanza, rendendo facile per il motore di ricerca trovare rapidamente e facilmente tutte le stanze all'interno della tua casa.
Ci sono una varietà di trucchi e suggerimenti SEO che ti aiuteranno a ottimizzare il tuo sito web, e uno di questi è l'uso dei file della mappa del sito. L'importanza del file Sitemaps a volte è molto sottovalutata. Ancora una volta, una mappa del sito è una mappa letterale del tuo sito web. Semplificano la navigazione nel tuo sito Web e, quando mantieni un file della mappa del sito aggiornato per il tuo sito Web, è adatto non solo a te stesso ma anche ai motori di ricerca. I file Sitemap sono un modo essenziale per comunicare tra un sito e un motore di ricerca.
In che modo un sito Web trarrà vantaggio da un file della mappa del sito?
L'uso di un file della mappa del sito ha così tanti vantaggi. Non solo fornisce una mappa per navigare nel tuo sito web, ma offre una migliore visibilità ai motori di ricerca. Un file della mappa del sito offre l'opportunità di collegare i motori di ricerca a tutte le modifiche apportate alle pagine del tuo sito Web immediatamente dopo che si sono verificate. Non puoi aspettarti che i motori di ricerca si affrettino a rendere conto delle modifiche alle tue pagine, ma cambieranno senza dubbio le modifiche che hai apportato più velocemente rispetto a quando un sito Web non ha un file della mappa del sito.
Quando c'è un collegamento della mappa del sito a un sito Web e viene inviato ai motori di ricerca, farai meno affidamento su collegamenti esterni quando i motori di ricerca portano visitatori al tuo sito. Quando hai un file della mappa del sito e lo invii ai motori di ricerca, fai meno affidamento su collegamenti esterni che porteranno i motori di ricerca al tuo sito web.
Il file della mappa del sito aiuta anche a correggere i collegamenti interni scadenti. Ad esempio, se ci sono collegamenti interrotti accidentalmente o pagine orfane che non possono essere raggiunte. Va notato che non è un'idea saggia fare affidamento su una mappa del sito piuttosto che semplicemente correggere i tuoi errori. È necessario ricordare che l'uso di un file della mappa del sito non garantisce che tutti gli URL nella mappa del sito verranno scansionati e indicizzati, poiché i processi dei motori di ricerca si basano su algoritmi complessi per pianificare la scansione. Tuttavia, nella maggior parte dei casi, il tuo sito web trarrà vantaggio dall'avere un file sitemap e non sarai mai penalizzato per averne uno.
Paternità: Arturo S.