it-swarm.com.de

Entfernen Sie Subdomains aus dem Google-Index und beenden Sie die Indizierung

Ich verwende statische Inhalte über ein CDN, cdn1-cdn5. Ich verwende dafür solche Subdomains.

Ich lade nur Bilder, CSS- und JS-Dateien auf diese Weise, aber anscheinend hat Google einige Seiten in Subdomains indiziert und sie erscheinen jetzt im Google-Index und sind Duplikate meiner "normalen" Seiten.

Das Problem ist, dass CDN so eingestellt ist, dass Dateien in Subdomains angezeigt werden, ohne dass zusätzliche Inhalte hochgeladen werden. Dies bedeutet, dass Subdomains Spiegelkopien von Inhalten sind, die sich auf der Hauptseite befinden. Ich kann keine Dateien hochladen Für Subdomains kann ich auf die Hauptseite hochladen und in der Adressleiste "www" in "cdn1" ändern, um über das CDN den gleichen Inhalt wie auf meiner Webseite anzuzeigen.

Ich habe 2 Fragen:

  1. wie entferne ich die Subdomains aus dem Google-Index in GWT, wenn damit nur alles geschrieben werden kann, was nach " http://domain.com/ " steht?
  2. Wie verhindere ich, dass Bots die Seiten in Subdomains indizieren, wenn ich keine speziellen robots.txt-Dateien oder google-Bestätigungsdateien hochladen kann, um meine Inhaberschaft an GWT zu beweisen?

Vielleicht gibt es noch etwas, das ich in Bezug auf diese Angelegenheit wissen muss?

UPDATE: Fett gedruckter Text wird aktualisiert

6
CamSpy

Sie können die Unterdomänen in den Webmaster-Tools entfernen. Zunächst müssen Sie jedoch die Unterdomänen als separate Sites hinzufügen und dann eine Site-Entfernung übermitteln. Sie sollten innerhalb eines Tages verschwunden sein.

Anweisungen zum Entfernen einer Website aus Google finden Sie hier: https://support.google.com/webmasters/answer/1663427?hl=de

6
user29671

Kurze Antwort.

Fügen Sie <meta name="robots" content="noindex"> für alle Seiten in die Kopfzeile Ihres HTML ein. Sobald die Suchmaschinen diese Seiten entdeckt haben und Sie sich sicher sind, setzen Sie

User-agent: *
Disallow: /

... in einer robots.txt-Datei im Stammverzeichnis jeder Unterdomäne.

Dies wird natürlich einige Zeit dauern. Normalerweise kann es 30 bis 60 Tage dauern, bis Google die Änderungen bemerkt und sie in den SERPs wiedergibt. Je nachdem, wie Google die Frische Ihrer Subdomains beurteilt, kann dies weniger oder mehr Zeit in Anspruch nehmen.

1
closetnoc

Es gibt verschiedene Möglichkeiten, hier haben Sie einige, Sie können nur eine verwenden oder sie kombinieren

Über die robots.txt können Sie es verwenden, aber es ist viel besser, eine Lösung zu verwenden, die robuster ist und der alle Crawler folgen müssen, wie die Umleitung.

Hier sehen Sie ein kurzes Video von Matt Cutts über 301 Redirects vs rel = "canonical" . Ein kurzer Auszug aus dieser Seite und dem Video wäre:

Okay, ich bekomme manchmal die Frage, ob Google die URL von rel = canonical immer als bevorzugte URL verwenden wird. Die Antwort ist, dass wir rel = canonical urls als starken Hinweis nehmen, aber in einigen Fällen werden wir sie nicht verwenden:

  • Wenn Sie beispielsweise der Meinung sind, dass Sie sich versehentlich in den Fuß geschossen haben (indem Sie rel = canonical auf eine nicht vorhandene/404-Seite richten), behalten wir uns das Recht vor, die mit rel = canonical angegebene Ziel-URL nicht zu verwenden .
  • Ein weiteres Beispiel, in dem wir uns nicht an Ihre Präferenz für rel = canonical halten: Wenn wir glauben, dass Ihre Website gehackt wurde und der Hacker ein böswilliges rel = canonical hinzugefügt hat. Ich habe kürzlich über diesen Fall getwittert. Wenn ein Hacker Ihre Website so gut steuern kann, dass er ein rel = canonical-Tag einfügt, handelt er in der Regel mit weitaus bösartigeren Dingen wie dem Einfügen von Malware, versteckten oder bösartigen Links/Texten usw.

Auf dem Video nennt er einige weitere Situationen und Gründe, wie die Tatsache, dass 301 von allen befolgt werden muss.

0
PatomaS