it-swarm.com.de

Google indexiert Wordpress WP-Inhaltsverzeichnisse und alle internen Dateien

Kürzlich habe ich festgestellt, dass die Gesamtzahl der Crawl-Seiten erhöht wurde. Also suchte ich bei Google mit site: und bekam mehrere Seiten mit einem Verzeichnis wp-content. Ich habe auch die Google Search Console überprüft und im 17. Juni 2018 gab es einen enormen Anstieg der Anzahl gecrawlter Seiten:

enter image description here

Und am selben Tag ging der Website-Traffic zurück. Wenn ich mich nicht irre, hat Google mehrere unerwünschte Seiten im Verzeichnis wp-content gecrawlt. Dies könnte das Hauptproblem sein. Sehen Sie sich diesen Screenshot an (der Traffic ging ab dem 16. Juni 2018 zurück) ): enter image description here

Hier ist ein Screenshot des indizierten Verzeichnisses wp-content:

enter image description here

Bitte führen Sie an, wie Sie Google stoppen, um das Crawlen von "wp-content" -Verzeichnissen zu stoppen, damit doppelte und leere Seiten nicht gecrawlt werden und gleichzeitig das Crawlen von Originalseiten nicht beeinträchtigt wird.

1
Kittu

Zunächst sollten Sie die Indexierung blockieren durch:

Starten Sie zweitens das Löschen der bereits indizierten URLs aus dem Google-Index mit Tool zum Entfernen von Google-URLs

Leider können Sie mit dem obigen Tool nur einen nach dem anderen löschen. Sie können 410 Fehler für diese URLs generieren (die zweite Option, die ich zuvor kommentiert habe). Beachten Sie jedoch, dass es sich um eine erweiterte Serverkonfiguration handelt, da Sie nur verhindern möchten, dass die URLs indiziert werden, aber dennoch auf sie zugreifen müssen sie als admin.

2
Emirodgar

Das Problem ist, dass Ihr Server eine automatische Seite für alle Verzeichnisse erstellt, in der alle Dateien in diesem Verzeichnis aufgelistet sind.

In Apache wird diese Funktion von mod_autoindex bereitgestellt. Befindet sich keine index.html -Datei im Verzeichnis, erstellt dieses Apache-Modul automatisch eine Seite mit einer Verzeichnisliste.

Eine Möglichkeit, dies zu verhindern, besteht darin, leere index.html-Dateien in jedem Verzeichnis zu erstellen. Google indiziert keine leeren Seiten. Es würde sie als "weiche 404" -Seiten behandeln.

Eine andere Möglichkeit besteht darin, die Verzeichnislisten zu deaktivieren. Dies kann entweder in Ihren Apache . Conf -Dateien oder in Ihren . Htaccess Datei, solange AllowOverides aktiviert ist.

Options -Indexes

Weitere Beispiele finden Sie im Abschnitt "Verzeichnislisten" von https://wiki.Apache.org/httpd/DirectoryListings

1