Come utilizzare un validatore Sitemap per risolvere gli errori

Pubblicato: 2022-02-01

L'invio di una mappa del sito XML può fornire ai motori di ricerca un'analisi completa di ogni pagina del sito Web che desideri indicizzare. Pertanto, è un passaggio essenziale nella tua strategia di ottimizzazione per i motori di ricerca (SEO). Tuttavia, per ottenere i migliori risultati possibili, dovrai utilizzare un validatore della mappa del sito per assicurarti di non inviare file con errori.

In questo articolo parleremo di cosa sono i validatori di mappe del sito e di come funzionano. Quindi ti guideremo attraverso gli errori comuni che potresti incontrare quando utilizzi un validatore di mappe del sito e come risolverli. Andiamo a farlo!

Che cos'è un validatore di mappe del sito?

Una mappa del sito è un file che contiene un elenco di tutti gli URL del tuo sito Web che desideri vengano indicizzati dai motori di ricerca. Le Sitemap sono disponibili in formato XML o HTML, essendo la prima l'opzione più popolare.

Tecnicamente, non è necessario inviare una mappa del sito del tuo sito Web a Google o ad altri motori di ricerca. Queste piattaforme utilizzano i crawler per navigare nel tuo sito, identificare ogni URL e indicizzare quelle pagine. Tuttavia, la creazione di una mappa del sito ti dà il controllo completo su quali URL indicizzano i motori di ricerca e quali no (come contenuto privato o ridondante).

Nella maggior parte dei casi, utilizzerai mappe del sito generate automaticamente. Se utilizzi WordPress, i plugin SEO come Yoast possono aiutarti a creare mappe del sito che puoi inviare a Google Search Console:

Impostazioni della mappa del sito Yoast SEO

Un validatore di mappe del sito è uno strumento in grado di elaborare quei file XML o HTML e assicurarsi che non contengano errori. Per "errori" intendiamo:

  • Pagine che i motori di ricerca non possono scansionare
  • 404 errori
  • 401 errori
  • Troppi URL nella mappa del sito
  • URL non canonici

Se la tua mappa del sito contiene uno di questi errori, i motori di ricerca potrebbero non essere in grado di indicizzare tutte le pagine che elenchi. La lettura manuale dei file XML per trovare problemi può richiedere molto tempo ed è inoltre necessario testare gli URL. Fortunatamente, i validatori delle mappe del sito ti consentono di saltare tutto il lavoro e iniziare a correggere gli errori che identificano.

Come utilizzare un validatore di mappe del sito

Usare un validatore di mappe del sito è semplice. A seconda dello strumento che utilizzi, potresti dover caricare un file XML o fornire un URL alla mappa del sito del tuo sito web. Quest'ultima opzione potrebbe essere applicata se utilizzi uno strumento come XML Sitemap Validator.

Validatore di mappe del sito XML

Inserisci l'URL della mappa del sito che desideri controllare e lo strumento restituirà un rapporto che include tutti gli errori rilevati.

Un rapporto di convalida XML

Se ottieni un rapporto pulito senza problemi, i motori di ricerca possono indicizzare gli URL all'interno della mappa del sito. Puoi inviare in sicurezza la mappa del sito a Google, Bing, Yandex o dove vuoi senza paura. Tuttavia, se si verificano errori, è necessario sapere come risolverli. Questo ci porta alla sezione successiva.

5 Errori comuni della mappa del sito e come risolverli

Sfortunatamente, alcune mappe del sito non vengono convalidate perfettamente, ma tratteremo alcuni degli errori più comuni che i validatori delle mappe del sito possono trovare nei file che invii loro. Iniziamo discutendo le pagine con "problemi" di scansione.

1. Pagine con problemi di scansione

I problemi di scansione sono tra i problemi più comuni che i validatori restituiranno. Questo errore indica che il servizio non è stato in grado di eseguire la scansione di una delle pagine nella tua mappa del sito.

In genere, quando il validatore o il motore di ricerca non è in grado di eseguire la scansione di una pagina, si tratta di uno dei seguenti scenari:

  • La pagina impiega troppo tempo per essere caricata. Se il caricamento del tuo sito Web impiega troppo tempo, la connessione con il crawler scadrà. Ciò significa che alcune pagine potrebbero non essere indicizzate.
  • Il tuo sito web utilizza troppi reindirizzamenti. Quando i reindirizzamenti non sono impostati correttamente, il tuo sito Web può finire in un ciclo di reindirizzamento. Ciò significa che i motori di ricerca non saranno in grado di scansionarlo.
  • Il sito Web impedisce ai motori di ricerca di scansionarlo. Puoi configurare WordPress per bloccare i crawler (usando i tag noindex ) in modo che il tuo sito web non venga indicizzato. In genere, potresti farlo mentre crei il tuo sito o crei pagine private.
  • La pagina restituisce un codice di errore diverso da 404 o 401. I validatori Sitemap possono analizzare 404 errori. Tuttavia, altri codici di errore HTTP genereranno un avviso di "problema di scansione".

L'errore "problemi di scansione" può essere ambiguo. Tuttavia, puoi determinare il problema esatto visitando l'URL in questione. Se la pagina viene caricata in modo rapido e corretto, il tuo sito Web potrebbe impedire ai motori di ricerca di eseguirne la scansione.

Se la pagina viene caricata senza errori, ti consigliamo di testare i tempi di caricamento del tuo sito web per vedere se ci sono problemi di prestazioni. In caso contrario, dovresti visualizzare codici di errore specifici o istanze di reindirizzamenti multipli.

2. 404 Errori

404 errori in una mappa del sito sono facili da risolvere. Se una pagina non esiste più, puoi rimuovere manualmente quella voce dalla mappa del sito o impostare un reindirizzamento per essa. L'opzione migliore per te dipenderà dal fatto che quella pagina stia ancora ricevendo traffico.

L'analisi del sito Web di Google Search Console e altri servizi rivelerà se una pagina 404 sta ancora ricevendo visitatori. In questo scenario, la soluzione migliore è impostare un reindirizzamento alla pagina o al post pertinente più vicino in modo da non perdere quel traffico. Finché utilizzi un singolo reindirizzamento, non si verificherà un errore di convalida della mappa del sito.

3. 401 Errori

Un errore 401 "non autorizzato" in una mappa del sito significa che i crawler non possono accedere a una pagina specifica perché non dispongono delle autorizzazioni necessarie. Questo errore di solito compare quando hai a che fare con una pagina che richiede agli utenti di accedere.

Un errore 401 non autorizzato

L'unica soluzione a questo errore è rimuovere le pagine che richiedono l'autorizzazione dalla mappa del sito. Qualsiasi pagina che solo gli utenti che hanno effettuato l'accesso possono vedere non deve essere indicizzata. In caso contrario, i visitatori che fanno clic su di esso nelle pagine dei risultati dei motori di ricerca (SERP) si troveranno ad affrontare un errore 401.

4. Troppi URL nella Sitemap

I motori di ricerca possono eseguire la scansione di enormi siti Web con migliaia di pagine. Tuttavia, secondo la nostra esperienza, le mappe dei siti iniziano a visualizzare errori se elenchi ovunque vicino (o oltre) 50.000 pagine.

Se questa è la tua situazione, allora complimenti per lo sforzo. 50.000 pagine sono tante . Tuttavia, la maggior parte dei siti Web con oltre 50.000 pagine ha probabilmente più URL da contenuti generati dagli utenti. In questo scenario, vuoi dare la priorità alle pagine più importanti del tuo sito rimuovendo le voci della mappa del sito che gli utenti potrebbero non voler vedere nelle SERP.

5. URL non canonici nella Sitemap

A volte, i motori di ricerca potrebbero confondersi quando vedono più versioni di un URL per la stessa pagina. Ad esempio, potresti essere in grado di accedere a una semplice pagina di blog utilizzando uno dei seguenti URL:

  • http://tuositoweb.com
  • http://www.tuositoweb.com
  • https://tuositoweb.com
  • https://www.tuositoweb.com

In pratica, tutti quegli URL possono portare alla stessa pagina (se reindirizzi il traffico HTTP su HTTPS). Tuttavia, i motori di ricerca potrebbero vedere quegli URL come quattro voci diverse in una mappa del sito, causando errori di convalida.

Il modo semplice per risolvere questo problema è designare un URL canonico per il tuo sito Web WordPress. I plugin SEO come Yoast assegneranno automaticamente gli URL canonici per il tuo sito. Se stai utilizzando un file XML generato da un plug-in SEO, non dovresti incappare nell'errore "non canonico" quando utilizzi un validatore di mappe del sito.

Conclusione

Man mano che il tuo sito web cresce, l'utilizzo di una mappa del sito diventa più critico. Le Sitemap ti consentono di dire ai motori di ricerca quali pagine devono indicizzare e quali ignorare. Inoltre, l'utilizzo di un validatore della mappa del sito ti aiuterà a individuare gli errori in modo che i crawler non si imbattano in problemi durante l'indicizzazione del tuo sito web.

Solo per ricapitolare, i cinque errori più comuni che potresti incontrare con un validatore di sitemap sono:

  1. Pagine con problemi di scansione: dovrai controllare i tempi di caricamento, i reindirizzamenti e visitare la pagina del tuo sito Web per determinare il problema esatto.
  2. Errori 404: questo errore significa che dovresti eliminare la pagina inesistente dalla tua mappa del sito o impostare un reindirizzamento per essa.
  3. Errori 401: prendi in considerazione la rimozione delle pagine limitate dalla tua mappa del sito.
  4. Troppi URL nella mappa del sito: potrebbe essere necessario essere selettivi riguardo alle pagine nella mappa del sito e rimuovere quelle meno utili.
  5. URL non canonici nella mappa del sito: consigliamo di impostare un URL canonico per pagine specifiche.

Hai domande sull'utilizzo di un validatore di mappe del sito? Parliamo di loro nella sezione commenti qui sotto!

Immagine in primo piano tramite hans / shutterstock.com