it-swarm.com.de

Ist es die Schuld des Google Webmaster-Crawlers oder ein Virus?

Letzten Tag, als ich Google Webmaster-Tools besuchte, fand ich Crawler-Fehler für 42 nicht gefundene Seiten. Alle Seiten hatten endlich "luminous-solutions.net" in der URL. Mögen

http://article-stack.com/2010/08/page/luminous-solutions.net

Ich hatte noch nie einen Beitrag geschrieben, der dieses Wort hat. Aus Sicherheitsgründen hatte ich es auf meiner Website manuell mithilfe der internen und externen Suchfunktion durchsucht. Ich hatte auch im Quellcode gesucht.

Ich hatte in der Datenbank gesucht, neu installierte Plugins, Theme-Code .... Aber ich habe nichts mit "luminous-solutions.net" gefunden

404 bedeutet, dass ein Teil des Inhalts auf diese Links verweist. Link existiert aber nicht. Ich hatte diese Seiten auch manuell überprüft.

Kann dieser Fehler durch den Google Crawler selbst oder durch einen Virus auf meiner Website verursacht worden sein?

2

Mach dir keine Sorgen um sie.

Es gibt viele Spam-Sites, die solche Links erstellen. GoogleBot erkennt sie an und versucht, der URI zu folgen, um nur eine 404 zu treffen. Wenn Sie in den entsprechenden Suchmaschinen nach link:http://article-stack.com/2010/08/page/luminous-solutions.net suchen, werden Sie häufig den Täter finden (andernfalls sind sie bereits erledigt).

Eine Suche nach nur link:luminous-solutions.net enthüllt eine Reihe typischer Spam-Mails.

Wenn Sie definitiv nicht möchten, dass Crawler ihnen folgen, erstellen Sie eine standardmäßig alle verweigern robots.txt und lassen Sie nur die URLs zu, von denen Sie wissen, dass sie zu korrekten Seiten führen (dies kann jedoch als übertrieben angesehen werden).

4
Metalshark

Vor einiger Zeit habe ich einige Spammer gesehen, die sich schlecht codierte Websitesuchen zunutze gemacht haben. Bei einigen Suchanfragen werden Webergebnisse angezeigt, wenn sie nichts von ihrer Website zurückgeben müssen (IE-Google-Suchergebnisse). Wenn die Website ihre Suchergebnisse nicht indiziert, kann ein Spammer leicht Suchergebnisse generieren, von denen er weiß, dass sie seine Website zurückgeben und ein paar Links erstellen, um sicherzustellen, dass die Seite indiziert wird und sie Links von Ihrer Website zu ihrer Website haben.

Ich habe dies in letzter Zeit nicht gesehen, da Google die Suchergebnisse nicht in den Ergebnissen anzeigen möchte und die URLs der Website-Suche recht einfach zu ermitteln sind, da sie normalerweise Parameter wie query = q = s = oder search = enthalten gute Arbeit, sie aus ihrem Index herauszuhalten.

Dies ist reine Theorie, aber in diesem Sinne scheint es möglich zu sein, benutzerdefinierte 404-Seiten auszunutzen (und für Google schwieriger zu erkennen). Viele Benutzer erstellen benutzerdefinierte 404-Dateien, um die Benutzer dahin zu leiten, wohin sie möchten. Ich habe eine Reihe von Websitesuchergebnissen gesehen, die anscheinend automatisch anhand von URL-Parametern ausgefüllt werden. Ich habe auch eine Reihe von benutzerdefinierten 404-Nachrichten gesehen, die indiziert wurden, weil sie einen 200-Status und nicht den echten 404-Status zurückgeben. Es ist logisch, wenn Sie beide kombinieren, um eine regelmäßig aussehende URL mit einer Liste von Links zu dieser Spam-Site zu erhalten.

Unabhängig davon sieht es so aus, als ob Ihre Site es richtig handhabt.

2
Joshak

Beim Crawlen Ihrer Website mit Xenu werden solche Links nicht angezeigt. Möglicherweise liegt das Problem in der übermittelten Sitemap. Können Sie uns einen Link zur Sitemap senden?

0
Ilian Iliev