Como usar um validador de sitemap para solucionar erros

Publicados: 2022-02-01

O envio de um sitemap XML pode fornecer aos mecanismos de pesquisa um detalhamento completo de todas as páginas do site que você deseja que eles indexem. Portanto, é um passo essencial na sua estratégia de Search Engine Optimization (SEO). No entanto, para obter os melhores resultados possíveis, você precisará usar um validador de sitemap para garantir que não esteja enviando arquivos com erros.

Neste artigo, falaremos sobre o que são validadores de sitemap e como eles funcionam. Em seguida, orientaremos você sobre os erros comuns que você pode encontrar ao usar um validador de sitemap e como solucioná-los. Vamos lá!

O que é um Validador de Sitemap?

Um mapa do site é um arquivo que contém uma lista de todos os URLs do seu site que você deseja que os mecanismos de pesquisa indexem. Os Sitemaps vêm em formato XML ou HTML, sendo o primeiro a opção mais popular.

Tecnicamente, você não precisa enviar um mapa do site do seu site para o Google ou outros mecanismos de pesquisa. Essas plataformas usam rastreadores para navegar em seu site, identificar cada URL e indexar essas páginas. No entanto, a criação de um mapa do site oferece controle total sobre quais URLs os mecanismos de pesquisa indexam e quais não deveriam (como conteúdo privado ou redundante).

Na maioria dos casos, você utilizará sitemaps gerados automaticamente. Se você usa o WordPress, plugins de SEO como o Yoast podem ajudá-lo a criar sitemaps que você pode enviar ao Google Search Console:

Configurações do mapa do site Yoast SEO

Um validador de sitemap é uma ferramenta que pode processar esses arquivos XML ou HTML e garantir que não contenham erros. Por “erros”, queremos dizer:

  • Páginas que os mecanismos de pesquisa não podem rastrear
  • erros 404
  • erros 401
  • Muitos URLs no mapa do site
  • URLs não canônicos

Se o seu sitemap contiver algum desses erros, os mecanismos de pesquisa podem não conseguir indexar todas as páginas que você listar. A leitura manual de arquivos XML para encontrar problemas pode levar muito tempo e você também precisa testar URLs. Felizmente, os validadores de sitemap permitem que você ignore todo esse trabalho e comece a corrigir os erros que identificarem.

Como usar um validador de Sitemap

Usar um validador de sitemap é simples. Dependendo de qual ferramenta você usa, pode ser necessário fazer upload de um arquivo XML ou fornecer um URL para o mapa do site do seu site. A última opção pode ser aplicada se você usar uma ferramenta como o XML Sitemap Validator.

Validador de mapa de site XML

Insira o URL do mapa do site que você deseja verificar, e a ferramenta retornará um relatório incluindo todos os erros encontrados.

Um relatório de validação XML

Se você obtiver um relatório limpo e sem problemas, os mecanismos de pesquisa poderão indexar os URLs no mapa do site. Você pode enviar o mapa do site com segurança para o Google, Bing, Yandex ou para onde quiser sem medo. No entanto, se você encontrar erros, precisará saber como corrigi-los. Isso nos leva à próxima seção.

5 erros comuns do Sitemap e como corrigi-los

Infelizmente, alguns sitemaps não são validados perfeitamente, mas abordaremos alguns dos erros mais comuns que os validadores de sitemaps podem encontrar nos arquivos que você envia a eles. Vamos começar discutindo as páginas com “problemas” de rastreamento.

1. Páginas com problemas de rastreamento

Problemas de rastreamento estão entre os problemas mais comuns que os validadores retornarão. Esse erro significa que o serviço não conseguiu rastrear uma das páginas do seu sitemap.

Geralmente, quando o validador ou mecanismo de pesquisa não consegue rastrear uma página, isso significa um dos seguintes cenários:

  • A página demora muito para carregar. Se o seu site demorar muito para carregar, a conexão com o rastreador atingirá o tempo limite. Isso significa que algumas páginas podem não ser indexadas.
  • Seu site usa muitos redirecionamentos. Quando os redirecionamentos não são configurados corretamente, seu site pode acabar em um loop de redirecionamento. Isso significa que os mecanismos de pesquisa não poderão rastreá-lo.
  • O site está impedindo que os mecanismos de pesquisa o rastreiem. Você pode configurar o WordPress para bloquear rastreadores (usando tags noindex ) para que seu site não seja indexado. Normalmente, você pode fazer isso ao criar seu site ou criar páginas privadas.
  • A página retorna um código de erro diferente de 404 ou 401. Os validadores de sitemaps podem analisar erros 404. No entanto, outros códigos de erro HTTP resultarão em um aviso de "problema de rastreamento".

O erro “problemas de rastreamento” pode ser ambíguo. No entanto, você pode determinar o problema exato visitando o URL em questão. Se a página for carregada de forma rápida e correta, seu site pode estar bloqueando os mecanismos de pesquisa de rastreá-la.

Se a página carregar sem erros, recomendamos testar os tempos de carregamento do seu site para ver se há problemas de desempenho. Caso contrário, você deverá ver códigos de erro específicos ou instâncias de vários redirecionamentos.

2. Erros 404

Erros 404 em um sitemap são fáceis de resolver. Se uma página não existir mais, você poderá remover essa entrada do mapa do site manualmente ou configurar um redirecionamento para ela. A melhor opção para você dependerá se essa página ainda está recebendo tráfego.

A análise de sites do Google Search Console e outros serviços revelarão se uma página 404 ainda está recebendo visitantes. Nesse cenário, sua melhor aposta é configurar um redirecionamento para a página ou postagem relevante mais próxima para que você não perca esse tráfego. Contanto que você use um único redirecionamento, isso não resultará em um erro de validação do sitemap.

3. Erros 401

Um erro 401 “não autorizado” em um sitemap significa que os rastreadores não podem acessar uma página específica porque não têm as permissões necessárias. Esse erro geralmente aparece quando você está lidando com uma página que exige que os usuários façam login.

Um erro 401 não autorizado

A única solução para este erro é remover as páginas que requerem autorização do mapa do site. Qualquer página que apenas usuários logados possam ver não deve ser indexada. Caso contrário, os visitantes que clicarem nele nas páginas de resultados dos mecanismos de pesquisa (SERPs) se depararão com um erro 401.

4. Muitos URLs no Sitemap

Os mecanismos de pesquisa podem rastrear sites enormes com milhares de páginas. No entanto, em nossa experiência, os sitemaps começam a exibir erros se você listar perto (ou mais) de 50.000 páginas.

Se essa é a sua situação, então parabéns pelo esforço. 50.000 páginas é muito . No entanto, a maioria dos sites com mais de 50.000 páginas provavelmente possui vários URLs de conteúdo gerado pelo usuário. Nesse cenário, você deseja priorizar as páginas mais importantes do seu site enquanto remove as entradas do sitemap que os usuários podem não querer ver nas SERPs.

5. URLs não canônicos no Sitemap

Às vezes, os mecanismos de pesquisa podem ficar confusos quando veem várias versões de um URL para a mesma página. Por exemplo, você pode acessar uma página de blog simples usando qualquer um dos seguintes URLs:

  • http://seusite.com
  • http://www.seusite.com
  • https://seusite.com
  • https://www.seusite.com

Na prática, todos esses URLs podem levar à mesma página (se você redirecionar o tráfego HTTP para HTTPS). No entanto, os mecanismos de pesquisa podem ver esses URLs como quatro entradas diferentes em um mapa do site, levando a erros de validação.

A maneira simples de resolver esse problema é designando um URL canônico para o seu site WordPress. Plugins de SEO, como o Yoast, atribuirão URLs canônicos ao seu site automaticamente. Se você estiver usando um arquivo XML gerado por um plugin de SEO, não deverá encontrar o erro “não canônico” ao usar um validador de sitemap.

Conclusão

À medida que seu site cresce, o uso de um sitemap se torna mais crítico. Os Sitemaps permitem que você diga aos mecanismos de pesquisa quais páginas eles devem indexar e quais devem ser ignoradas. Além disso, usar um validador de sitemap ajudará você a identificar erros para que os rastreadores não tenham problemas ao indexar seu site.

Apenas para recapitular, os cinco erros mais comuns que você pode encontrar com um validador de sitemap são:

  1. Páginas com problemas de rastreamento: você precisará verificar seus tempos de carregamento, redirecionamentos e visitar a página do seu site para determinar o problema exato.
  2. Erros 404: Este erro significa que você deve excluir a página inexistente do seu mapa do site ou configurar um redirecionamento para ela.
  3. Erros 401: considere remover as páginas restritas do seu mapa do site.
  4. Muitos URLs no mapa do site: talvez seja necessário ser seletivo sobre as páginas do mapa do site e remover as menos úteis.
  5. URLs não canônicos no mapa do site: recomendamos configurar um URL canônico para páginas específicas.

Você tem alguma dúvida sobre como usar um validador de sitemap? Vamos falar sobre eles na seção de comentários abaixo!

Imagem em destaque via hanss / shutterstock.com