it-swarm.com.de

Helfen Sie mit, Spam-Links zu entfernen, die zur 404-Seite führen

Eines Tages wurde meine Seite gehackt. Jemand hat Spam-Seiten in meine Site eingefügt. Ich habe das Problem behoben, die Datenbank gesäubert, den geschützten Login-Bereich usw. Aber diese Links sind immer noch in allen Suchmaschinen, einschließlich Google, vorhanden und führen zu 404 Seiten.

Ich habe eine XML-Sitemap mit 8 gültigen Seiten für meine Website. Diese Sitemap ist auf der Webmaster-Seite vorhanden und wurde am 23. August 2015 aktualisiert und zeigt nur 8 Seiten. Suchmaschinen löschen diese Spam-Links jedoch nicht.

Ich habe auch das Tool zum Entfernen von Links im Google Websmasters Tool ausprobiert. Es hat ungefähr 1 Monat lang geholfen und jetzt sind sie abgelaufen und dieser Link ist wieder vorhanden. Wie kann ich diese Spam-Links von Suchmaschinen entfernen?

1
Kirill Ryzhkov

Es gibt einige Verhaltensunterschiede, von denen Sie wissen sollten, dass sie Ihnen helfen können.

Nach einem Relaunch meiner Website und nach 301 Weiterleitungen auf neue Seiten habe ich mich entschlossen, 404-Fehler zu melden, aber den Datenverkehr, der möglicherweise durch benutzerdefiniertes HTML verloren gegangen ist, wieder aufzunehmen. Die 404-Seite hat wie erwartet funktioniert. Als ich jedoch den benutzerdefinierten 404-HTML-Code fallen ließ, stellte ich fest, dass 2 meiner Seiten einen 404-Code zurückgaben, aber auch HTML-Inhalt (soft) zurückgaben und indiziert blieben. Würden diese Seiten lediglich einen 404 ohne HTML-Code zurückgeben (hart), würde Google dies zur Kenntnis nehmen.

Es gibt im Endeffekt 2 weiche 404 Seiten. Eine besteht darin, den Code 404 auszugeben, und die andere darin, eine benutzerdefinierte Seite zu erstellen, die der Webserver ausgibt. Wenn Sie Code verwenden, wird der 404-Header möglicherweise korrekt ausgegeben. Wenn Sie jedoch HTML-Code ausgeben, wird er von Google möglicherweise nicht allzu ernst genommen. Dies kann von Sprache zu Sprache erfolgen. Ja. Sie erhalten eine 404, aber es scheint, dass Google es anders behandeln kann. Wenn möglich, ist es weitaus besser, den Webserver und nicht ein CMS die 404 ausstellen zu lassen.

Es scheint einen Unterschied darin zu geben, wie mit 404 umgegangen wird, wie Google mit 404 umgeht. Ich habe diese beiden Seiten noch nicht korrigiert und erhalte weiterhin Suchergebnisse von Google. Trotzdem gebe ich eine richtige 404-Antwort. Es ist auf meiner Liste natürlich zu beheben - ich bin nur ein bisschen langsam.

Wenn eine Seite nicht existiert, ist es am einfachsten, sie ohne HTML auf natürliche Weise auf dem Webserver verwenden zu lassen. Dies ist die Standardeinstellung für jeden Webserver. Einige CMS sind jedoch so eingerichtet, dass sie einen Soft 404-Wert liefern. Der Grund dafür ist, dass der Datenverkehr wiederhergestellt wird, der andernfalls verloren gehen würde. Google mag Soft 404 aus einem bestimmten Grund nicht, versteht aber, dass sie einen Wert haben. Google bevorzugt einen harten 404.

Es ist technisch korrekt, eine 410 für jede Seite anzubieten, die weg ist. Google behandelt 404 und 410 unterschiedlich. Jede Seite, die eine 410 zurückgibt, wird sofort aus dem Index entfernt und (im Allgemeinen) nicht erneut angefordert, während eine 404 als vorübergehendes Szenario angesehen wird und Google die Seite einige Male wiederholt, bevor die Seite aus dem Index entfernt wird.

Beachten Sie, dass diese Seiten, solange Links vorhanden sind, in regelmäßigen Abständen wiederholt werden können. Das wäre natürlich sinnvoll, aber so funktioniert es. Wenn Google einem Link folgt und die Seite aus dem Index entfernt, weil sie nicht vorhanden ist, markiert Google den Link als "toten Link" (verwirrender Begriff). In der Regel wird Google den Link nach 410 oder 404 Fehlern nicht erneut versuchen. Wenn jedoch ein neuer Link angezeigt wird, startet Google den Vorgang für den neuen Link erneut.

Solange Sie eine 410 oder eine 404 und kein HTML zurückgeben, ist alles in Ordnung. Wenn Sie jedoch eine 410 für die Seite ausgeben können, ist dies am besten. Es wäre sicherlich weniger ärgerlich und würde helfen, diese Seiten schneller zu löschen.

0
closetnoc