it-swarm.com.de

Bedeutung von Crawl-Fehler

Meine Frage bezieht sich auf die Definition von Crawling-Fehler in Google Webmaster-Tools. Crawling-Fehler sind in wenige Abschnitte unterteilt.

Betrachten wir zunächst den Abschnitt HTTP.

Ich gehe davon aus, dass alle defekten Links in diesem Bereich irgendwie vom Crawler gefunden wurden. Dies sind nicht die Links von der Sitemap. Wenn all diese Links gefunden wurden, indem Seiten von der Sitemap nach Links durchsucht wurden, warum wird nicht angegeben, welche Seite die Quelle war, wie im Sitemap-Abschnitt mit der Spalte Verknüpft von. Bitte korrigieren Sie mich, wenn ich falsch liege.

Sitemap Abschnitt.

Es sieht so aus, als ob all diese Links von meiner Sitemap stammen. Aber es gibt die Spalte Verknüpft von, ich weiß bereits, dass all diese defekten Links von der Sitemap stammen. Um den Fehler zu beheben, sollte ich meine Sitemap überarbeiten. Liege ich falsch?

Nicht gefolgt Abschnitt.

Ich weiß nicht, was das bedeutet. Sieht so aus, als würden alle Links gesammelt, die eine Weiterleitung verursacht haben. Aus irgendeinem Grund betrachtet Google alle Weiterleitungen als falsche Weiterleitung. Wissen Sie, ob es eine Reihe von Regeln gibt, mit denen Sie eine falsche Umleitung ermitteln können? Eigentlich habe ich festgestellt, dass es mein Fehler war, dass ich versucht habe, die URL zu normalisieren und zur richtigen URL umzuleiten, aber ich habe die Normalisierung auf eine falsche Weise durchgeführt.

Nicht gefunden Abschnitt.

Dieser Abschnitt ähnelt dem HTTP-Abschnitt, weist jedoch 404-Fehler auf. Dieser Abschnitt enthält die Spalte Verknüpft von. Aber sehr oft Verknüpft von hat nicht verfügbar. Was es heißt, Google kann mir nicht sagen, wie es diese nicht vorhandene Seite gefunden hat. Wie dieser Abschnitt zum Sitemap-Abschnitt gehörte. Enthält dieser Abschnitt auch alle 404 Links von der Sitemap? Es gibt aber zu viele 404-Links, viel mehr als in der Sitemap. Ich habe versucht, einen Blick auf das zu werfen, was wir in Linked From haben, und ich habe gesehen, dass dieser Link vor zwei Monaten von der Sitemap kam. Aber warum Google es indiziert, ist der Link bereits tot, neue Sitemap hat es nicht. Gibt es ein Ablaufdatum für alte Links?

Nicht erreichbar Abschnitt.

Sieht aus wie dieser Abschnitt für 500 Fehler. Dieser Abschnitt enthält keine Spalte Verknüpft von. Es gibt zu viele völlig bedeutungslose Links, ich weiß wirklich nicht, woher dieses Zeug stammt, und ohne Linked From kann ich nicht herausfinden, wie ich damit umgehen soll.

Es tut mir leid für ein so großes Thema, aber ich möchte nur klarstellen, wofür jeder Abschnitt steht, denn es ist äußerst wichtig, um all diese Probleme zu lösen. Hoffentlich wird es nicht nur für mich nützlich sein.

Vielen Dank!

7
com

Ich denke, Sie stimmen mit Ihren Annahmen größtenteils überein.

Der erste Abschnitt HTTP zeigt alle 4xx-Fehler mit Ausnahme von 404-Fehlern (die weitaus häufiger auftreten, also eine eigene Seite erstellen). Ich erhalte 400 (schlechte Anfrage) Fehler von CodeIgniter, die bestimmte Zeichen in URLs nicht zulassen. 403 (verboten) sind auch hier.

Der Abschnitt sitemap informiert Sie nur über eine URL in einer Sitemap, die nicht gefunden werden kann. Der Abschnitt "Verknüpft von" ist nützlich, damit Sie Verknüpfungen entfernen können, wenn eine Seite nicht mehr vorhanden ist.

Ich habe den Abschnitt nicht gefolgt noch nie gesehen, aber es hört sich so an, als würde er jede URL auflisten, die mit rel = ofollow verlinkt ist.

Nicht gefunden ist jeder 404-Fehler. Wahrscheinlich werden Seiten in Ihrer Sitemap aufgelistet, da diese offensichtlich auf Ihrer Site verlinkt sein sollten (mit anderen Worten, eine Seite, die nur in der Sitemap und nirgendwo verlinkt ist, würde hier nicht erscheinen).

Nicht erreichbar sind 5xx-Fehler, wie Sie sagten, bei denen es sich um Serverfehler handelt. "Verknüpft von" wird hier nicht angezeigt, da dies keine Rolle spielt und keine Seite jemals einen 5xx-Fehler zurückgeben sollte.

3
DisgruntledGoat