So verwenden Sie einen Sitemap-Validator zur Fehlerbehebung

Veröffentlicht: 2022-02-01

Das Einreichen einer XML-Sitemap kann Suchmaschinen eine vollständige Aufschlüsselung jeder Website-Seite liefern, die sie indexieren sollen. Daher ist dies ein wesentlicher Schritt in Ihrer Strategie zur Suchmaschinenoptimierung (SEO). Für die bestmöglichen Ergebnisse müssen Sie jedoch einen Sitemap-Validator verwenden, um sicherzustellen, dass Sie keine Dateien mit Fehlern senden.

In diesem Artikel sprechen wir darüber, was Sitemap-Validatoren sind und wie sie funktionieren. Dann führen wir Sie durch häufige Fehler, auf die Sie bei der Verwendung eines Sitemap-Validierers stoßen könnten, und wie Sie diese beheben können. Lasst uns anfangen!

Was ist ein Sitemap-Validator?

Eine Sitemap ist eine Datei, die eine Liste aller URLs auf Ihrer Website enthält, die von Suchmaschinen indexiert werden sollen. Sitemaps gibt es entweder im XML- oder im HTML-Format, wobei ersteres die beliebteste Option ist.

Technisch gesehen müssen Sie keine Sitemap Ihrer Website bei Google oder anderen Suchmaschinen einreichen. Diese Plattformen verwenden Crawler, um auf Ihrer Website zu navigieren, jede URL zu identifizieren und diese Seiten zu indizieren. Durch das Erstellen einer Sitemap haben Sie jedoch die vollständige Kontrolle darüber, welche URLs die Suchmaschinen indexieren und welche nicht (z. B. private oder redundante Inhalte).

In den meisten Fällen verwenden Sie automatisch generierte Sitemaps. Wenn Sie WordPress verwenden, können Ihnen SEO-Plugins wie Yoast dabei helfen, Sitemaps zu erstellen, die Sie an die Google Search Console senden können:

Yoast SEO-Sitemap-Einstellungen

Ein Sitemap-Validator ist ein Tool, das diese XML- oder HTML-Dateien verarbeiten und sicherstellen kann, dass sie keine Fehler enthalten. Mit „Fehlern“ meinen wir:

  • Seiten, die Suchmaschinen nicht crawlen können
  • 404-Fehler
  • 401 Fehler
  • Zu viele URLs in der Sitemap
  • Nicht-kanonische URLs

Wenn Ihre Sitemap einen dieser Fehler enthält, können Suchmaschinen möglicherweise nicht jede von Ihnen aufgeführte Seite indizieren. Das manuelle Lesen von XML-Dateien zum Auffinden von Problemen kann lange dauern, und Sie müssen auch URLs testen. Glücklicherweise können Sie mit Sitemap-Validierern all diese Arbeit überspringen und mit der Behebung aller Fehler beginnen, die sie identifizieren.

So verwenden Sie einen Sitemap-Validator

Die Verwendung eines Sitemap-Validierers ist einfach. Je nachdem, welches Tool Sie verwenden, müssen Sie möglicherweise eine XML-Datei hochladen oder eine URL zur Sitemap Ihrer Website angeben. Die letztere Option könnte zutreffen, wenn Sie ein Tool wie XML Sitemap Validator verwenden.

XML-Sitemap-Validator

Geben Sie die URL für die Sitemap ein, die Sie überprüfen möchten, und das Tool gibt einen Bericht mit allen gefundenen Fehlern zurück.

Ein XML-Validierungsbericht

Wenn Sie einen sauberen Bericht ohne Probleme erhalten, können Suchmaschinen die URLs innerhalb der Sitemap indizieren. Sie können die Sitemap ohne Angst sicher an Google, Bing, Yandex oder wo immer Sie wollen einreichen. Wenn Sie jedoch auf Fehler stoßen, müssen Sie wissen, wie Sie diese beheben können. Das bringt uns zum nächsten Abschnitt.

5 häufige Sitemap-Fehler und wie man sie behebt

Leider werden einige Sitemaps nicht perfekt validiert, aber wir behandeln einige der häufigsten Fehler, die Sitemap-Validierer in den Dateien finden können, die Sie ihnen übermitteln. Beginnen wir damit, Seiten mit Crawling-„Problemen“ zu besprechen.

1. Seiten mit Crawling-Problemen

Crawling-Probleme gehören zu den häufigsten Problemen, die von Validatoren zurückgegeben werden. Dieser Fehler bedeutet, dass der Dienst eine der Seiten in Ihrer Sitemap nicht crawlen konnte.

Wenn der Validator oder die Suchmaschine eine Seite nicht crawlen kann, bedeutet dies im Allgemeinen eines der folgenden Szenarien:

  • Das Laden der Seite dauert zu lange. Wenn das Laden Ihrer Website zu lange dauert, kommt es zu einer Zeitüberschreitung bei der Verbindung mit dem Crawler. Das bedeutet, dass einige Seiten möglicherweise nicht indiziert werden.
  • Ihre Website verwendet zu viele Weiterleitungen. Wenn Weiterleitungen nicht korrekt eingerichtet sind, kann Ihre Website in einer Weiterleitungsschleife enden. Das bedeutet, dass Suchmaschinen es nicht crawlen können.
  • Die Website blockiert Suchmaschinen am Crawlen. Sie können WordPress so konfigurieren, dass Crawler blockiert werden (unter Verwendung von noindex -Tags), sodass Ihre Website nicht indexiert wird. Normalerweise tun Sie dies beim Erstellen Ihrer Website oder beim Erstellen privater Seiten.
  • Die Seite gibt einen anderen Fehlercode als 404 oder 401 zurück. Sitemap-Validatoren können 404-Fehler parsen. Andere HTTP-Fehlercodes führen jedoch zu einer „Crawling-Problem“-Warnung.

Der Fehler „Crawling-Probleme“ kann mehrdeutig sein. Sie können jedoch das genaue Problem ermitteln, indem Sie die betreffende URL besuchen. Wenn die Seite schnell und korrekt geladen wird, blockiert Ihre Website möglicherweise Suchmaschinen am Crawlen.

Wenn die Seite fehlerfrei geladen wird, empfehlen wir, die Ladezeiten Ihrer Website zu testen, um festzustellen, ob es Leistungsprobleme gibt. Andernfalls sollten Sie bestimmte Fehlercodes oder Instanzen mehrerer Weiterleitungen sehen.

2. 404-Fehler

404-Fehler in einer Sitemap sind einfach zu beheben. Wenn eine Seite nicht mehr existiert, können Sie diesen Eintrag manuell aus der Sitemap entfernen oder eine Weiterleitung dafür einrichten. Die beste Option für Sie hängt davon ab, ob diese Seite noch Zugriffe erhält.

Website-Analysen von Google Search Console und anderen Diensten zeigen, ob eine 404-Seite noch Besucher erhält. In diesem Szenario ist es am besten, eine Weiterleitung zur nächstgelegenen relevanten Seite oder zum nächstgelegenen Beitrag einzurichten, damit Sie diesen Traffic nicht verpassen. Solange Sie eine einzelne Weiterleitung verwenden, führt dies nicht zu einem Sitemap-Validierungsfehler.

3. 401-Fehler

Ein 401-Fehler „nicht autorisiert“ in einer Sitemap bedeutet, dass Crawler nicht auf eine bestimmte Seite zugreifen können, weil sie nicht über die erforderlichen Berechtigungen verfügen. Dieser Fehler tritt normalerweise auf, wenn Sie es mit einer Seite zu tun haben, auf der sich Benutzer anmelden müssen.

Ein nicht autorisierter 401-Fehler

Die einzige Lösung für diesen Fehler ist das Entfernen von Seiten, die eine Autorisierung erfordern, aus der Sitemap. Jede Seite, die nur angemeldete Benutzer sehen können, sollte nicht indexiert werden. Andernfalls werden Besucher, die auf den Suchmaschinen-Ergebnisseiten (SERPs) darauf klicken, mit einem 401-Fehler konfrontiert.

4. Zu viele URLs in der Sitemap

Suchmaschinen können riesige Websites mit Tausenden von Seiten crawlen. Unserer Erfahrung nach zeigen Sitemaps jedoch Fehler an, wenn Sie annähernd (oder mehr) 50.000 Seiten auflisten.

Wenn das Ihre Situation ist, dann ein großes Lob für die Mühe. 50.000 Seiten sind viel . Die meisten Websites mit über 50.000 Seiten haben jedoch wahrscheinlich mehrere URLs von nutzergenerierten Inhalten. In diesem Szenario möchten Sie die wichtigsten Seiten Ihrer Website priorisieren und gleichzeitig Sitemap-Einträge entfernen, die Benutzer möglicherweise nicht in den SERPs sehen möchten.

5. Nicht-kanonische URLs in der Sitemap

Manchmal sind Suchmaschinen verwirrt, wenn sie mehrere Versionen einer URL für dieselbe Seite sehen. Beispielsweise können Sie möglicherweise über eine der folgenden URLs auf eine einfache Blogseite zugreifen:

  • http://ihrewebsite.com
  • http://www.ihrewebsite.com
  • https://ihrewebsite.com
  • https://www.ihrewebsite.com

In der Praxis können alle diese URLs auf dieselbe Seite führen (wenn Sie den HTTP-Datenverkehr auf HTTPS umleiten). Suchmaschinen sehen diese URLs jedoch möglicherweise als vier verschiedene Einträge in einer Sitemap, was zu Validierungsfehlern führt.

Der einfache Weg, dieses Problem zu lösen, besteht darin, eine kanonische URL für Ihre WordPress-Website festzulegen. SEO-Plugins wie Yoast weisen Ihrer Website automatisch kanonische URLs zu. Wenn Sie eine von einem SEO-Plug-in generierte XML-Datei verwenden, sollten Sie bei der Verwendung eines Sitemap-Validierers nicht auf den „non-canonical“-Fehler stoßen.

Fazit

Wenn Ihre Website wächst, wird die Verwendung einer Sitemap immer wichtiger. Mit Sitemaps können Sie Suchmaschinen mitteilen, welche Seiten sie indizieren und welche ignorieren sollen. Darüber hinaus hilft Ihnen die Verwendung eines Sitemap-Validators, Fehler zu erkennen, damit Crawler beim Indexieren Ihrer Website nicht auf Probleme stoßen.

Um es noch einmal zusammenzufassen, die fünf häufigsten Fehler, auf die Sie bei einem Sitemap-Validierer stoßen könnten, sind:

  1. Seiten mit Crawling-Problemen: Sie müssen Ihre Ladezeiten und Weiterleitungen überprüfen und Ihre Website-Seite besuchen, um das genaue Problem zu ermitteln.
  2. 404-Fehler: Dieser Fehler bedeutet, dass Sie die nicht vorhandene Seite aus Ihrer Sitemap löschen oder eine Weiterleitung dafür einrichten sollten.
  3. 401-Fehler: Erwägen Sie, eingeschränkte Seiten aus Ihrer Sitemap zu entfernen.
  4. Zu viele URLs in der Sitemap: Möglicherweise müssen Sie bei den Seiten in Ihrer Sitemap selektiv vorgehen und weniger nützliche entfernen.
  5. Nicht-kanonische URLs in der Sitemap: Wir empfehlen, für bestimmte Seiten eine kanonische URL einzurichten.

Haben Sie Fragen zur Verwendung eines Sitemap-Validators? Lassen Sie uns im Kommentarbereich unten darüber sprechen!

Vorgestelltes Bild über hanss/shutterstock.com