it-swarm.com.de

Was kann in der neuen GWT dazu führen, dass "Erkannt - derzeit nicht indiziert"

Das neue GWT zeigt Sitemaps-Links, die in neue Kategorien unterteilt sind. Zwei, die mich verwirren: 1. Entdeckt - derzeit nicht indiziert. 2. Gecrawlt - derzeit nicht indiziert

Was sind die möglichen Gründe dafür und gibt es Auswirkungen auf die gesamte Site? Ist dies ein Zeichen von Google, das ich entfernen sollte?

enter image description here

13
Noam

Dies ist nur ein Teil des Prozesses. Sie müssen nichts tun, bis Sie tatsächlich Fehler erhalten..

Um die Kategorien zu verstehen, müssen Sie wissen, wie die Indizierung funktioniert.

  • Googlebot ruft eine Seite ab, bei der der Inhalt auf Google-Server heruntergeladen wird. In diesem Fall wird die Seite gecrawlt .
  • Der Inhalt der heruntergeladenen Seite wird später in den Index aufgenommen. Dies bedeutet, dass die Seite indexiert ist .
  • Beim Durchsuchen der Seite werden "Gefällt mir" gefunden und in eine Warteschlange gestellt. Diese Links werden entdeckt .

So:

  • Nicht indiziert entdeckt bedeutet, dass der Link der Warteschlange von Dingen hinzugefügt wurde, die der Googlebot möglicherweise möglicherweise kriechen. Da das Web praktisch unendlich ist und es eine Priorisierung gibt, wird es möglicherweise nie dort ankommen.
  • Derzeit nicht indexiert gecrawlt bedeutet, dass die Seite auf Google-Server heruntergeladen wurde, ihr Inhalt jedoch nicht in den Index eingefügt wurde.
7
Itai

Google kann Ihre Seiten möglicherweise entdecken und crawlen, dies bedeutet jedoch nicht, dass es sie unbedingt indizieren muss.

Es gibt viele Gründe, warum Google eine Seite möglicherweise nicht indiziert. Vielleicht hat es doppelten Inhalt gefunden. Vielleicht hat es nicht das Gefühl, dass es genug Wert für bestimmte Suchanfragen bietet. Möglicherweise hat Google etwas an Ihrer Seite gefunden, das ihm nicht gefällt.

Was auch immer der Grund sein mag, Google hat sich einfach nicht entschlossen, einige der Seiten, die es auf Ihrer Website entdeckt und gecrawlt hat, zu indizieren. Es ist ganz normal, dass einige Ihrer Seiten nicht indiziert werden. Einige der Seiten auf meinen Websites sind nicht indexiert, obwohl sie einen besseren Inhalt als viele indexierte Seiten und eine erhebliche Anzahl interner Links aufweisen. Das Indizierungssystem von Google ist ein Algorithmus für maschinelles Lernen. Aus verschiedenen unbekannten Gründen kann es daher vorkommen, dass bestimmte Seiten nicht indexiert werden.

2
Michael d

Der Googlebot hat eine eigene Warteschlange, die auf verschiedenen Parametern basiert. Dies ist die Meldung, dass diese URLs sogar in die Warteschlange gestellt werden.

enter image description here

Aj Cohn hat eine Art lustige Meinung über die Bedeutung dieser Nachricht:

Erkannt - Derzeit nicht indiziert, weist dies darauf hin, dass sie es in Ihrer Sitemap sehen, aber basierend auf dem Aussehen anderer Inhalte werden sie sich nicht einmal darum kümmern, es zu crawlen. Im Grunde genommen "Ya hässlich!" Oder es ist nur eine Darstellung der schlechten Crawling-Effizienz.

Ehrlich gesagt bin ich mir nicht ganz sicher, ob die Definition von "Erkannt" korrekt ist, da viele der Beispiel-URLs in diesem Status das Datum des letzten Crawls aufweisen. Dies scheint der Definition zu widersprechen.

1
Evgeniy

Obwohl Google die URL entdeckt hat, war sie nicht wichtig genug, um Zeit mit dem Crawlen zu verbringen. Wenn Sie möchten, dass diese Seite organischen Suchverkehr erhält, sollten Sie die Verlinkung von Ihrer eigenen Website aus verstärken. Stellen Sie sicher, dass Sie diese Inhalte anderen zur Verfügung stellen, in der Hoffnung, dass Sie Backlinks von externen Websites erhalten. Externe Links zu Ihren Inhalten sind ein Signal an Google, dass eine Seite wertvoll ist und als vertrauenswürdig eingestuft wird, wodurch sich die Wahrscheinlichkeit erhöht, dass sie indexiert wird.

0
ts.tsogtgerel