it-swarm.com.de

Wie kann man Spam-Referrer wie darodar.com vom Zugriff auf die Website abhalten?

Ich habe mehrere Websites, die täglich etwa 5% der Besuche von Spam-Empfängern erhalten. Ich habe bei diesen Verweisen etwas Merkwürdiges bemerkt: Sie werden in Google Analytics angezeigt, aber ich kann sie nicht in meiner benutzerdefinierten Tabelle sehen, in der ich alle Besucher der Website einfüge. Daher denke ich, dass sie nur die GA manipulieren. Code, erreicht niemals die Website selbst.

Wenn Sie dem Link folgen, werden Sie zu einigen Partnerlinks weitergeleitet.

Ich weiß nicht, ob sie Einfluss auf mein SEO/SERP haben, aber ich möchte sie loswerden. Darf ich das über htaccess Datei machen?

Ein besonderer Aspekt ist, dass ich Besucher aus verschiedenen Foren wie Seiten bekomme. Zum Beispiel: forum.topic221122.darodar.com, forum.topic125512.darodar.com usw., daher möchte ich die vollständige darodar.com-Domäne blockieren. 

Neben darodar.com gibt es auch econom.co und iloveitaly.co, die meine Statistiken stören. Kann ich sie alle von htaccess blockieren?

21
Catalin Marcu

Dieser Blogbeitrag legt nahe, dass die Spam-Verweise Google Analytics manipulieren und Ihre Website niemals tatsächlich besuchen. Google Analytics bietet Filterung wenn Sie gefälschte Website-Treffer abschwächen möchten.

12
ab7

Die meisten Spam-Nachrichten in Google Analytics greifen niemals auf Ihre Website zu. Sie können sie daher nicht mit einer serverseitigen Lösung blockieren.

Ghost Spam trifft direkt auf GA und wird in der Regel nur für einige Tage angezeigt und verschwindet. Deshalb glauben manche Leute, sie hätten sie aus der Datei .htaccess blockiert, sind aber nur Zufall. 

Diese Art von Spam ist leicht zu erkennen, da sie entweder einen falschen Hostnamen verwenden oder nicht festgelegt sind. (Siehe Bild unten)

Der andere Typ, Crawlers wie semalt, greift tatsächlich auf Ihre Website zu und kann von der .htaccess-Datei blockiert werden. Es gibt jedoch nur einige davon.

Also zusammenfassend, um Spam in Google Analytics zu stoppen:

  • Crawlers: serverseitige Lösungen oder Filter in GA
  • Ghosts: filtert NUR in GA

Die einzige effiziente Lösung, um zu verhindern, dass Sie von Ghost-Spam getroffen werden, ist das Erstellen eines include-Filters mit allen gültigen Hostnamen

Zuerst müssen Sie eine REGEX mit allen gültigen Hostnamen erstellen, etwa so (Sie können sie im Netzwerkbericht finden)

yoursite\.com|shoppingcart\.com|translateservice\.net

Dies sind einige Beispiele. Möglicherweise haben Sie mehr oder weniger Hostnamen. Nachdem Sie den REGEX installiert haben, gehen Sie wie oben beschrieben vor und ändern Sie dies:

  • Wechseln Sie zur Registerkarte admin in Google Analytics 
  • Wählen Sie FILTER unter View Column> New Filter aus. 
  • FiltertypBenutzerdefiniert> Include> FilterfeldHostname 
  • Dateimuster Kopieren Sie den von Ihnen erstellten Hostnamenausdruck

Für Crawler müssen Sie einen anderen Filter erstellen, der mit allen Spammern einen Ausdruck erstellt

spammer1|spammer2|spammer3|spammer4|spammer5
  • FiltertypBenutzerdefiniert> Ausschließen> FilterfeldKampagnenquelle 
  • Dateimuster Kopiert den Verweisausdruck

Bei jeder Arbeit mit Filtern ist es wichtig, dass Sie eine ungefilterte Ansicht beibehalten.

Wenn Sie detaillierte Schritte für diese Lösungen benötigen, können Sie diese vollständige Anleitung zu Spam in Google Analytics lesen.

Anleitung zum Stoppen und Entfernen aller Spam-Nachrichten in Google Analytics

Ich hoffe es hilft.

Hostname-Bericht Beispiel valid hostnames

41
Carlos Escalera

Ja, du kannst mit .htaccess blockieren und eigentlich solltest du es tun.

Ihre .htaccess -Datei könnte folgendermaßen aussehen:

<IfModule mod_setenvif.c>
# Set spammers referral as spambot
SetEnvIfNoCase Referer darodar.com spambot=yes
SetEnvIfNoCase Referer 7makemoneyonline.com spambot=yes
## add as many as you find

Order allow,deny
Allow from all
Deny from env=spambot
</IfModule>

Wenn Datenverkehr von diesen Sites kommt, werden sie mit diesem .htaccess blockiert, sodass der HTML-Code niemals geladen wird und das Skript GA daher nicht ausgelöst wird (von diesen Sites).

Sie versuchen, den Datenverkehr von Ihnen zu erfassen, sobald Sie den eingehenden Datenverkehr in Google Analytics sehen und herausfinden, welche Quelle Sie zu dieser URL führen. Es ist für Ihre Website harmlos, außer Ihre Statistiken sind voll mit Junk-Daten.

Google Analytics sollte dies verhindern, genauso wie GMail Spam-E-Mails verhindert.

6

Laut diesem Eintrag besuchen sie niemals Ihre Site. Sie fälschen die HTTP-Anfrage an GA mit Ihrem UA-Code. Daher scheint es sinnlos zu sein, sie mithilfe von .htaccess oder einer anderen Methode zu blockieren, da sie niemals auf Ihre Website gelangen und nur falsche Besuchsdaten an Google senden.

3
nikoskip

Wir haben festgestellt, dass die Verwendung von htaccess ein guter Weg ist, um diese Spams zu stoppen. Ich habe unten eine Lösung auf meiner Kunden-Site implementiert, die bisher sehr gut funktioniert. Die beste Möglichkeit ist, sie durch Klausel zu stoppen, z. Spam priceg.com prüft auf Preis in Referrer-URL.

Da viele dieser Sites Subdomains erstellen und neu treffen, und wenn sie die URL optimieren, schlagen hartcodierte Bedingungen fehl 

RewriteCond% {HTTP_REFERER} (priceg) [NC, OR]
RewriteCond% {HTTP_REFERER} (darodar) [NC, OR]

Es wird detailliert erklärt hier

2
Wrenky

anscheinend geschieht dies durch einen Spammer, indem er direkt mit Google Analytics unter Verwendung der Konto-ID Ihrer Website kommuniziert. So teilen sie Google Analytics effektiv mit, dass sie Ihre Seite besucht haben, während dies in der Tat nie der Fall war. Sie identifizieren sich zur Analyse anhand einer URL, die SIE BESUCHEN MÖCHTEN. Sie sehen also ihren Traffic in Google Analytics und checken sie aus. Sie haben ein Amazon-Affiliate-Konto angeschlossen und versuchen daher, eine Provision von Ihren Amazon-Käufen zu erhalten.

also tat der Erfolg nichts für mich, als ich mit diesem kämpfte; Sie müssen einen Filter erstellen, der Dinge wie (. *) /. darodar/.com herausfiltert

der eigentliche schlimme Effekt, den ich hier gefunden habe, ist, dass meine Website-Statistiken ungültig werden

1
brett bazant

Lunametrics hat einen Nizza-Artikel veröffentlicht, um dieses Problem mit Google Tag Manager zu lösen: http://www.lunametrics.com/blog/2014/03/11/goodbye-to-exclude-filters-google-analytics/

0

Filtern Sie zukünftige und historische Spam-Mails aller Art mit dem angegebenen Link. Die Hostnamenfilterung ist besonders einfach.

https://www.ohow.co/ultimate-guide-to-removing-irrelevant-traffic-in-google-analytics/

0
Jan S

Sie können die Verwendung des Zugriffs .htaccess einschränken oder ALLE Roboterbesuche von Google Analytics filtern lassen. Wenn dies nicht funktioniert, richten Sie die Google Analytics-Filterung ein. Weitere Informationen dazu finden Sie hier: http://www.wiyre.com/google-analytics-darodar-forum-spam-what-is-it/

Sie sind in Russland ansässig, aber ihre Spinnen durch China und die Philippinen. Vielleicht ist es am besten, die gesamte IP-Adresse zu diesem Zeitpunkt zu sperren, da sie mehrere Subdomains haben. 

0
Jarrome D.

Ich habe diese mod_rewrite-Methoden für Semalt verwendet:

RewriteCond %{HTTP_REFERER} ^http(s)?://(www\.)?semalt\.com.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http(s)?://(.*\.)?semalt\.*$ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?://([^.]+\.)*semalt\.com\ [NC,OR]

oder mit dem .htaccess-Modul mod_setenvif

SetEnvIfNoCase Referer semalt.com spambot=yes
SetEnvIfNoCase REMOTE_ADDR "217\.23\.11\.15" spambot=yes
SetEnvIfNoCase REMOTE_ADDR "217\.23\.7\.144" spambot=yes

Order allow,deny
Allow from all
Deny from env=spambot

Ich habe sogar eine Blacklist für Apache, Nginx & Varnish sowie ein Google Analytics-Segment erstellt, um Spam-Referrer-Verkehr zu verhindern. Sie finden ihn hier:

https://github.com/Stevie-Ray/referrer-spam-blocker/

0

Das Blockieren von Bots auf Webserver-Ebene ist nicht sinnvoll. Spammer senden falsche Anfragen an den Google Analytics-Webserver. Alles, was sie wissen müssen, ist der Domain-Name der Website und die damit verknüpfte Google Analytics-ID ... Sie müssen Ihre Google Analytics-ID im Website-Code maskieren. Zum Beispiel können Sie dies mit dem Code für Google Analytics JS tun:

ga('create', 'UA-X' + 'XXXXX' + 'XX-X', 'auto');

Der Bot von Spammer sollte in der Lage sein, JS-Code auszuführen, um Ihre Google Analytics-ID nach dieser Änderung zu analysieren (und nicht so viele Bots können dies tun).

https://nobodyonsecurity.com/security/fighting-google-analytics-referrer-spam

0
Alek

Ich denke, der effektivste Weg, um Geister-Spam zu vermeiden, besteht darin, eine benutzerdefinierte Dimension hinzuzufügen, die Sie darüber informiert, dass die Website tatsächlich besucht wurde.

ga('set', 'dimension1', "Hey I'm really here!!");
ga('send', 'pageview');

Sie sollten diese Zeilen einfach in Ihre Seiten einfügen und dann einen Filter für "include" hinzufügen, wenn in diesem Fall die Dimension den erwarteten Wert ("Hey, ich bin wirklich hier !!") hat

0
Diego

Der Zugriff ist nicht der beste Weg. In meiner Site verwende ich GA, die Option Tracking-Informationen und dann Referenzliste.

Grüße!

0
davidcm86

Aktualisierung 2019

Möglicherweise habe ich eine Lösung für dieses Problem, da ich keine der anderen Lösungen für effektiv halte.

Lassen Sie mich zunächst auf die Probleme der vorhandenen Lösungen eingehen

  1. Fügen Sie für jede verweisende Spam-Domain einen Filter hinzu.
  2. Wie viele Domains werden Sie hinzufügen?
  3. Die meisten dieser Referrer-Spam-Domains existieren für einige Zeit und verschwinden dann
  4. Führen Sie eine Blacklist mit Referrer-Spam-Domains.
  5. Dies wird noch komplizierter, da sie im Grunde unendlich viele sind.
  6. Sie müssten die schwarze Liste ständig aktualisieren.
  7. Je größer die schwarze Liste, desto mehr Zeit wird zum Scannen benötigt
  8. Alles andere, wie das Aufrechterhalten eines manuellen Zugriffs oder etwas anderes, erfordert manuelle Eingriffe, die sich nicht skalieren lassen, wenn Ihre Site populärer wird
  9. Alles, was automatisch geschieht, wie z. B. die Verwendung von KI, um Muster für die Anzeige von Spam-Domains zu ermitteln, hat eine Treffer-/Fehlerursache

Wie funktionieren diese Bots?

Zunächst ist es wichtig zu verstehen, wie diese Bots funktionieren

  1. Sie verwenden mindestens Regex-Muster wie/UA-\d {6} /, um Tracking-IDs zu laden, die sie nach dem Start auf einer Seed-Website rekursiv aufrufen

Ich glaube, ich habe eine Lösung, die die folgenden Vorteile bietet

  1. Keine Notwendigkeit, Whitelists und Blacklists zu pflegen
  2. Funktioniert problemlos gegen 99% von ihnen und kann jederzeit auf 100% geändert werden
  3. Erfordert fast KEIN manuelles Eingreifen
  4. Die Idee ist, KEINE Tracking-ID im Skript zu haben

Hier ist ein Beispiel

script.
      //- Google Analytics ID
      var a = [85, 65, 45, 49, 49, 49, 49, 49, 49, 49, 49, 49, 45, 50];

      var newScript = document.createElement("script");
      newScript.type = "text/javascript";
      newScript.setAttribute("async", "true");
      newScript.setAttribute("src", "https://www.googletagmanager.com/gtag/js?id=" + a.map(i => String.fromCharCode(i)).join(""));
      document.documentElement.firstChild.appendChild(newScript);

      window.dataLayer = window.dataLayer || [];
      function gtag(){dataLayer.Push(arguments);}
      gtag('js', new Date());
      gtag('config', a.map(i => String.fromCharCode(i)).join(""), { 'send_page_view': false });
      // Feature detects Navigation Timing API support.
      if (window.performance) {
        // Gets the number of milliseconds since page load
        // (and rounds the result since the value must be an integer).
        var timeSincePageLoad = Math.round(performance.now());
        console.log(timeSincePageLoad)
        // Sends the timing event to Google Analytics.
        gtag('event', 'timing_complete', {
          'name': 'load',
          'value': timeSincePageLoad,
          'event_category': '#{title}'
        });
      }
  1. Wir gehen ganz einfach vor und teilen die Tracking-ID des Formulars 'UA-1111111-1' in ein Zeichencode-Array auf

  2. Jetzt erstellen wir die Tracking-ID dynamisch aus dem Zeichencode-Array, und zwar an jedem Punkt, an dem wir einen Verweis auf die Tracking-ID benötigen

  3. Der Ansatz kann unendlich komplexer gestaltet werden, indem er in eine verschlüsselte Reihe von Zahlen (Basis 8, hexadezimal) umgewandelt wird, ein fester Versatz und ein zufälliger Versatz bei jedem Lauf hinzugefügt werden. RSA verschlüsselt die Tracking-ID mit einem privaten Schlüssel auf dem Server und entschlüsselt sie mit Ein öffentlicher Schlüssel, aber der grundlegende Ansatz ist WIRKLICH schnell, da Arrays in JS sehr schnell sind und 99% der Bots leicht schlagen können

0
PirateApp