it-swarm.com.de

Indizierung von Bildern oder Dateien verhindern

Ich verstehe, dass Sie Folgendes tun können, um generell zu verhindern, dass Bilder oder Seiten indiziert werden.

Zum Meta-Bereich der Seite hinzufügen:

<meta name="robots" content="noindex" />

Bearbeiten Sie die robots.txt-Datei:

User-agent: *
Disallow: /images/

User-agent: *
Disallow: /$folder/whatever.jpg

User-agent: *
Disallow: /$folder/*.gif$

User-agent: Googlebot-Image
Disallow: /$folder/*.gif$

Angenommen, Sie haben eine Seite, die indiziert ist, und Sie haben ein Bild, auf das in einem Stylesheet (Hintergrundbild, was auch immer) verwiesen wird, oder ein Bild in einem normalen img-Tag.

<img src="/$folder/img.gif" alt="whatever title="yadda" />

Entsprechend der robots.txt sollte der Ordner oder ein bestimmtes Bild nicht indiziert werden, die Seite wird jedoch indiziert (kein No-Index).

Werden die Suchmaschinen in einem bestimmten Googlebot-Image der Anfrage nachkommen? Indizieren Sie die Seite bis zum Ausschluss des Bildes in einem IMG-Tag?

Wird es auch der Bitte nach gestalteten Hintergrundbildern nachkommen?

4
Bob M

Werden die Suchmaschinen in einem bestimmten Googlebot-Image der Anfrage nachkommen? Indizieren Sie die Seite bis zum Ausschluss des Bildes in einem IMG-Tag?

Ja. Unabhängig davon, wie auf das Bild auf Ihrer Website verwiesen wird (img Element, CSS-Hintergrundbild usw.), kann Googlebot-Image dieses Bild nicht crawlen, wenn es von robots.txt blockiert wird wird höchstwahrscheinlich verhindern, dass das Bild indexiert und in der Google-Bildersuche zurückgegeben wird.

Wenn das Crawlen von Seiten in robots.txt blockiert ist, können sie trotzdem indexiert (und möglicherweise in den SERPs zurückgegeben) werden, wenn andere externe Seiten auf sie verlinken (obwohl dies nur eine URL ist - in der wird kein Titel oder eine Beschreibung angezeigt) SERPs, da die Seiten selbst nicht gecrawlt wurden). Ich habe jedoch kein ähnliches Ergebnis in Bezug auf Bilder gesehen. Wenn das Bild durch robots.txt blockiert ist, wird es nicht indiziert.

Sie können das gleiche robots "Meta-Tag" (insbesondere den HTTP-Antwortheader X-Robots-Tag bei Nicht-HTML-Ressourcen) auf Bilder anwenden, wie Sie es auf Seiten tun können, wenn Sie dies möchten ist in der Regel bedingungslos und gilt für alle Bots und User Agents.

2
MrWhite

Ich glaube, X-Robots-Tag "noindex" ist ideal für diesen Fall.

Headerset X-Robots-Tag "noindex"

sie können Beispiele sehen, wie png-, jp (e) g- und gif-Dateien noindexiert werden. Das ist speziell für eine Apache .htaccess-Datei. Die Implementierung auf anderen Servern wäre etwas anders - aber Sie haben die Idee.

Wenn die Dinge noch nicht indiziert sind, können Sie das Problem möglicherweise auch mit einem robots.txt-Block beheben. Sobald sie indiziert sind, müssen Sie einen noindex verwenden, um sie zu entfernen.

0