it-swarm.com.de

Blackhat - Kopieren von Mitbewerberinhalten, bevor diese indiziert werden

Der Titel fasst die Frage ziemlich gut zusammen. Ich bin in einer sehr wettbewerbsintensiven Nische.

Trotz einer relativ starken Website werden meine Inhalte nicht immer sofort indexiert.

Ich hatte kürzlich einen Fall, in dem ein Konkurrent meinen Inhalt kopierte - das genaue Duplikat veröffentlichte, aber er wurde für den Beitrag eingestuft, obwohl ich ihn schrieb.

FRAGE:

  1. Wenn der Inhalt noch nicht von Google indiziert ist , kann er dann von jedem kostenlos abgerufen und auf seine Website kopiert werden? , In der Hoffnung, dass die gestohlene Kopie vor der Originalkopie indexiert wird? Kommt das oft als Black-Hat-Technik vor?
  2. Mir ist klar, dass Sie den Abruf als Google in der Suchkonsole verwenden und dann an den Index senden können. In der Regel werden meine Inhalte dabei sofort indiziert. ABER ich mache das nicht immer gerne, sondern bevorzuge Google, um Inhalte auf natürliche Weise zu entdecken. Ist es falsch, dass ich die Entdeckung natürlicher Inhalte will, und sollte ich jeden Beitrag nur manuell an den Index senden?

Alle Antworten/Vorschläge willkommen.

6
Timothy Coetzee

Ich bin sicher, dass dies ein häufiges Problem in wettbewerbsorientierten Umgebungen ist, und dies umso mehr, wenn der Inhalt ein Nischenthema ist.

F: Wenn der Inhalt noch nicht von Google indiziert wurde, kann er von jedermann kostenlos abgerufen und auf ihre Website kopiert werden. In der Hoffnung, dass die Kopie gestohlen wird wird vor der Originalkopie indexiert? Kommt das oft als Black-Hat-Technik vor?

A: Es sind viele unbekannte Faktoren bekannt, wenn es darum geht, wann und wie Googlebot das Crawling durchführt. Zum Beispiel Google crawlt zuerst https vor http . Als Eigentümer des Inhalts haben Sie das alleinige Recht, diesen Inhalt zu verbreiten. Sollten Sie in Abhängigkeit von Ihrem Aufenthaltsort einen Urheberrechtsanspruch geltend machen, können Sie möglicherweise rechtliche Schritte einleiten.

Sie können sich auch direkt an den Webmaster wenden und die Löschung des Inhalts beantragen, auch wenn dies nicht immer Früchte trägt. Alternativ können Sie auch Who Is Hosting This in Betracht ziehen, um den Host zu identifizieren und ihn direkt zu kontaktieren. Mehr als oft wird der Webhost sachdienlichere Maßnahmen ergreifen und die Website möglicherweise sogar vollständig offline schalten, um den doppelten Inhalt zu entfernen.

Eine andere Option wäre Google DMCA (Digital Millennium Copyright Act) . Direkt von google.com entnommen:

Diese Seite hilft Ihnen dabei, an die richtige Stelle zu gelangen, um Inhalte zu melden, die Sie nach geltendem Recht aus den Google-Diensten entfernen möchten.

Aber letztendlich passiert das in freier Wildbahn , Sie sind sicherlich nicht die einzige Person, die dies erlebt.

Die gute Nachricht ist, dass Sie über eine breite Palette von Tools verfügen, mit denen Sie solche Verhaltensweisen in Zukunft verhindern können:

  • Google Alerts : Sie können beispielsweise einen Teil Ihres Artikels einfügen und auswählen, welche Arten von Websites durchsucht werden sollen Geben Sie Ihre E-Mail-Adresse an, damit Google Sie mit den Ergebnissen kontaktieren kann. (Sie können so viele Warnungen einrichten, wie Sie möchten, und die Einstellungen so anpassen, dass sie täglich, wöchentlich oder "wie es geschieht" benachrichtigt werden.).

  • Copyscape: Dies ist eine kostenpflichtige Option, aber diese Site durchsucht das Web und teilt Ihnen mit, welche Sites Ihre Website erneut veröffentlichen Inhalt.

F: Mir ist klar, dass Sie den Abruf als Google in der Suchkonsole verwenden und dann an den Index senden können. Normalerweise werden meine Inhalte dabei sofort indexiert. ABER Ich mache das nicht immer gerne, sondern bevorzuge Google, um Inhalte auf natürliche Weise zu entdecken. Ist es falsch, dass ich die Entdeckung natürlicher Inhalte will, und sollte ich jeden Beitrag nur manuell an den Index senden?

Dies ist eher eine subjektive Frage, da es in diesem Fall wirklich kein "falsch" oder "richtig" gibt. Wenn Sie den Content letztendlich direkt an Google senden, wird sich herausstellen, dass er schneller indexiert wird, und dies kann die Wahrscheinlichkeit verringern, dass Sie in dieser Situation sitzen.

Eine weitere gute Option ist das Posten über Google +, das praktisch sofort indexiert wird.

Letztendlich ist SEO kein Ziel, sondern eine lebenslange Aufgabe, die ständige Nachverfolgung und kontinuierliche Aufmerksamkeit erfordert. Dies ist einfach eines der Hindernisse, die Sie auf Ihrem Weg erleben werden. Die Tatsache, dass Sie das Verhalten bereits bemerkt haben, versetzt Sie einem Großteil Ihrer Konkurrenz um Meilen voraus, also gut gemacht!

2
Moose

Machen Sie Ihre Website schwieriger zu kratzen

Die meisten Schaber laden Ihren RSS-Feed herunter, um Ihre neuen Inhalte zu sehen. Wenn Sie den vollständigen Inhalt Ihrer Artikel in Ihren RSS-Feed einfügen, ist es sehr einfach, den vollständigen Inhalt abzurufen und erneut zu veröffentlichen. Um dem entgegenzuwirken, sollten Sie nur eine Artikelzusammenfassung in RSS-Feeds einfügen oder RSS insgesamt deaktivieren.

Ein weiterer Mechanismus, den Scraper verwenden können, sind XML-Sitemaps. Sie können Google Zugriff auf Ihre XML-Sitemap gewähren, ohne sie potenziellen Scrapern anzuzeigen. Geben Sie dazu der Sitemap einen benutzerdefinierten Namen und senden Sie ihn über die Suchkonsole an Google. Verknüpfe es nicht und füge es nicht in deine robots.txt-Datei ein.

Scraper verlassen sich auf Bots, um Ihre Inhalte abzurufen. Sie kommen, um Ihre Website mit diesem Bot häufig zu sehen. Sehen Sie in Ihren Serverprotokollen nach, ob Sie dieses Verhalten erkennen und IP-Adressen blockieren können, die möglicherweise zu Content Scrapern gehören.

Das Veröffentlichen Ihrer Inhalte unter einer nicht verknüpften URL, bis Google sie indiziert, ist eine weitere Strategie, die ich eingesetzt habe. In WordPress können Sie beispielsweise die Funktion "Entwurf" verwenden, die den Artikel von der Homepage fernhält. In der Zwischenzeit teilen Sie Google die Seite mit und lassen Sie sie crawlen.

Bringen Sie Google dazu, Ihre Inhalte schneller zu indizieren

Wir haben eine Frage dazu mit guten Antworten .

Das manuelle Übermitteln von Seiten an die Google Search Console ist eine Möglichkeit, Ihre Inhalte schnell zu indizieren. Es gibt andere Methoden, um Google über Ihre Inhalte zu informieren:

  • XML-Sitemap-Dateien
  • Ping-Dienste wie https://pingomatic.com/ . Sie informieren Google über neue Inhalte und wenn Ihre Website einen ausreichenden Ruf hat, wird Google sie schnell crawlen.
  • Veröffentlichen Sie einen Link zu Ihrem Artikel auf Twitter. Google hat Zugriff auf ihre "firehose" und crawlt in der Regel innerhalb weniger Minuten die auf Twitter verlinkten Inhalte.

Viele Content-Management-Systeme verfügen über integrierte Funktionen oder Plugins, um diese automatisch für Sie zu erledigen.

Reagieren Sie auf Scraper-Sites

Wenn Sie Scraper-Sites mit Ihren Inhalten finden, können Sie diese manchmal mit DMCA-Anfragen entfernen.

In der Vergangenheit hat von Google angefragt nach Berichten über Abstreiferseiten gefragt, die über dem Original liegen. Ihr Einreichungsprozess ist nun jedoch abgeschlossen. Ich kenne derzeit keinen Ort, an dem ich das bei Google einreichen kann.

0