it-swarm.com.de

Wie kann ich verhindern, dass Google über Bilder von meiner Website aus crawlt?

Ich kümmere mich um eine Website mit mehreren Bildern, die von externen Links stammen.

Die Sache ist, diese Links sind ausgehende, und ich möchte das so weit wie möglich vermeiden.

Ich habe es schwer mit einer Lösung, die darin bestand, rel="nofollow" zu meinen Links hinzuzufügen, aber die Sache ist, dass W3C explizit ist: Dies ist nicht erlaubt.

Meine erste Frage lautet also: Wie würde Google darauf reagieren?

Der zweite Gedanke, den ich mir gestellt habe: Kann ich Google über robots.txt anweisen, nicht weiter zu crawlen? Wenn ja, wie soll ich das machen?

Ich habe gelesen, dass Regex in robots.txt nicht erlaubt ist und ich kann nicht so etwas wie Disallow: /*.jpg$ verwenden, da ich einige meiner Bilder zum Crawlen brauche.

Bearbeiten:

Ich habe gerade daran gedacht:

User-agent: *    
Allow: /images/*.jpg$
Disallow: /*.jpg$

Da sich alle unsere persönlichen Bilder in einem bestimmten Ordner befinden. Würde es funktionieren?

3
Baldráni

Sie haben Recht, rel=nofollow ist nur für Links. Das Tag <img> darf nicht das Attribut rel = nofollow haben.

Was meinst du mit

google nicht erlauben, durch Bilder von meiner Website zu crawlen?

Google Bot crawlt nicht, wenn er auf ein externes Bild stößt. Es erkennt es nur positiv (oder manchmal negativ) und indiziert es möglicherweise - Google kann kein Bild crawlen. Ihre Website wird so gecrawlt, wie sie ist, mit oder ohne externe Bildlinks.

Was rel=nofollow (im Falle eines externen Links) von Google sagt, ist, dass Sie die Website nicht positiv empfehlen und lediglich einen Link bereitstellen. Auch wenn Sie externe Links ohne Nofollow haben, hat dies keinen Einfluss auf das Crawlen Ihrer Website.

Ich bin mir nicht sicher, ob es ein ähnliches Attribut wie nofollow für Bilder gibt, und das ist zu Recht so, da Bilder nur indexiert und nicht gecrawlt/verfolgt werden können. Ob Sie die Indizierung von Bildern zulassen oder nicht, liegt in den Händen des Eigentümers des Bildes (der externen Website), der die Indizierung von Bildern über robots.txt zulassen oder nicht zulassen kann. Es liegt jedoch nicht in Ihrer Entscheidung.

User-agent: Googlebot-Image
Disallow: / 
4
Aakash