it-swarm.com.de

Wie erkennt Google das Veröffentlichungsdatum eines Beitrags?

Wenn ich etwas in Google suche, sehe ich manchmal das Veröffentlichungsdatum des Posts/Artikels darunter. Ich habe auch nach einem eigenen Artikel gesucht, den ich auf meiner von Wordpress betriebenen Website habe, und Google erkennt auch das Veröffentlichungsdatum.

Wenn ich die Quelle meiner Website öffne, werden keine speziellen Tags oder sonstigen Elemente angezeigt, die das Veröffentlichungsdatum angeben. Es ist nur in einem regulären div geschrieben, mit keinem speziellen Tag, der der SE mitteilt, dass es das Veröffentlichungsdatum ist (ich könnte auch andere Daten für andere Dinge auf der Seite haben).

Ist es also fest in Google codiert, wo genau das Wordpress -Veröffentlichungsdatum im DOM-Baum liegt, oder fehlt mir etwas?

Ich erstelle eine neue Website mit meinem eigenen CMS und versuche herauszufinden, wie die Datumserkennung implementiert werden kann.

17
Can Poyrazoğlu

sie sollten die XML-Sitemap- oder RSS-Feed-Version durchgehen, um Ihre Veröffentlichungsdaten über die wichtigsten Suchmaschinen wie Google, Yahoo und MSN zu indizieren. Generieren Sie eine XML-Sitemap für Ihre Website und senden Sie sie in den Webmaster-Tools für den Index.

4
eThan Hunt

Ich hatte gerade das Problem, dass alle meine Hauptseiten vor über 4 Jahren als aktualisiert angezeigt wurden, obwohl Google weiß das nicht stimmt, weil die Seiten so lange indexiert wurden und sich seit dem Monat erheblich geändert haben zu monat. Nachdem ich wirklich verwirrt, dann wirklich genervt und dann wieder verwirrt war, fand ich endlich das Problem. Unsere rechtlichen Bestimmungen wurden in einem versteckten Bereich mit dem Vermerk "Zuletzt aktualisiert: 30. Oktober 2007" angezeigt und der Bereich wurde auf fast allen unseren Seiten geladen. (Weil es bei der Registrierung auftaucht) Ich habe es entfernt und gehe jetzt davon aus, dass das Datum entweder verschwindet oder auf etwas Vernünftigeres korrigiert wird.

Eine warnende Geschichte und ein weiterer Beweis dafür, dass sie die Semantik der Site mehr prüfen als die technischen Details oder ihren eigenen Indexverlauf.

7
mmdanziger

Ich bezweifle sehr, dass das Veröffentlichungsdatum eines Posts oder Artikels auf dem <lastmod> -Eintrag in einer XML-Sitemap (wie von anderen vorgeschlagen) oder dem zuletzt geänderten HTTP-Header basiert. Eine XML-Sitemap ist nur eine Empfehlung, keine verbindliche. Das letzte Änderungsdatum eines Dokuments stimmt wahrscheinlich nicht mit dem (ursprünglichen) Veröffentlichungsdatum eines Artikels überein. Und wie ich in meinem Kommentar oben auf der Seite erwähnt habe, ist das letzte Änderungsdatum eines Dokuments wahrscheinlich wichtiger für das Zwischenspeichern und vielleicht Bestimmen der Durchforstungsraten. Der zuletzt geänderte HTTP-Header dynamisch generierter Seiten befindet sich häufig sehr nahe am tatsächlichen Datum/der Uhrzeit (wie bei WordPress Blogs).

Ein RSS/Atom-Feed hingegen enthält dieses spezifische Nugget an Informationen. Auf Wordpress Websites, auf denen das Veröffentlichungsdatum nicht im Inhalt enthalten ist, wird das Veröffentlichungsdatum weiterhin in den Suchergebnissen von Google angezeigt. Und soweit ich das beurteilen kann, stimmt dies mit dem Datum im RSS-Feed überein.

BEARBEITEN 1: Ein RSS-Feed enthält jedoch nicht unbedingt alle Seiten. In den meisten Fällen sollte es nur die neuesten oder zuletzt aktualisierten Seiten enthalten. Es gibt jedoch keinen Grund, dass Google vergisst, was es bereits gelesen hat, und dass sich der Inhalt dieser Seite nicht geändert hat und auch das Datum der letzten Änderung nicht.

Wenn es keinen RSS-Feed gibt, ist Google meiner Meinung nach clever genug, um den Seiteninhalt zu analysieren. Insbesondere, wenn Daten mit Hilfe von Mikroformaten 'semantisch' markiert werden. Es ist durchaus möglich, dass Google Folgendes als maßgebliches Veröffentlichungsdatum für einen darin enthaltenen Artikel ansieht:

<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>

Google liest sicherlich Mikroformate - hCard, hReview, etc.

Um es hinzuzufügen, ich glaube nicht, dass Google ein Veröffentlichungsdatum angeben würde, wenn es nicht in der Lage wäre, etwas maßgebliches zu finden, das dies nahe legt. Es wird kein "Veröffentlichungsdatum" für spekulative Daten hergeleitet, da ein falsches "Veröffentlichungsdatum" für niemanden von Nutzen ist und Google viel Geld dafür bekommen würde!

Und nur zur Veranschaulichung (wenn @Tom etwas anderes vorschlägt :) Ich denke, bei Posts/Artikeln sollte das Veröffentlichungsdatum sichtbar angezeigt werden. Viele tun dies nicht, und dies kann für den Leser frustrierend sein, insbesondere wenn er technologische Probleme untersucht und feststellt, dass es veraltet ist, den Artikel zur Hälfte durchgelesen zu haben!

EDIT # 2: Ich habe seitdem einen ähnlichen Ärger erlebt, den @mmdanziger in seiner Antwort ausführlicher beschreibt. Auf einer meiner alten Seiten habe ich oben auf jeder Seite (geschrieben) Text des Formulars "Site Last Updated Sun 17th Jun 2012" (nicht in besonderer Weise gekennzeichnet) zur Seite mit JavaScript !!). Dieses gleiche Datum wurde von Google abgeholt und erscheint nun neben mehreren (aber nicht allen) Seiten, die im SERPS erscheinen - dies ist sicherlich nicht das Veröffentlichungsdatum der Seite. Es scheint, dass Google die Seite einfach nach einer Zeichenfolge mit der Form "Zuletzt aktualisiert ( datestring )" durchsucht (nachdem JavaScript verarbeitet wurde !!). Diese Website hat keinen RSS-Feed. Die Site verfügt zwar über eine Sitemap.xml-Datei, die Daten sind jedoch unterschiedlich.

Ich habe ein ähnliches Verhalten auch auf anderen Websites festgestellt.

7
MrWhite

Ich denke, Google verwendet Sitemap und RSS-Feed, um das Veröffentlichungsdatum zu erkennen. Sie können diese Funktion in Ihrem CMS implementieren, indem Sie eine XML-Sitemap gemäß Standards erstellen.

<lastmod>2011-08-18</lastmod>
5
Vamsi Krishna B

Ich denke, es sucht auf intelligente Weise nach Daten auf der Seite und wenn es sicher ist, dass es das relevante Datum ist, wird es verwendet.

Es ist manchmal ein wenig schwierig, da ich denke, dass es negative Auswirkungen auf die Klickfähigkeit von SERP haben kann. Ich nehme an, es kann vorübergehend positive Auswirkungen haben, wenn es sich um einen aktuellen Artikel/Post handelt, aber ich bin mir ziemlich sicher, dass meine Websites dies sind wäre ohne besser dran (Google-Sucher wären aber ohne nicht besser dran!)

Es gibt keine Optionen, um es über Google zu steuern, nur mit Ihren eigenen Methoden. Du kannst entweder:

  • Ersetzen Sie Daten durch dynamisch generierte Bilder, um zu verhindern, dass Google sie entdeckt. Dies kann jedoch zu anderen Problemen führen, wie z. B. visuelle Ausrichtung/einheitliche Schriftanzeige/Barrierefreiheit usw.
  • Entfernen Sie alle Daten von den Seiten (dies kann wiederum für Besucher/Benutzer frustrierend sein, wenn sie das Alter einer Quelle ermitteln möchten, wenn Sie relevante Informationen haben).

Aus diesen Gründen würde ich es einfach ignorieren.

1
Tom Gullen

Laut Jonh Mueller bei Google:

Wir verwenden eine Vielzahl von Signalen, um zu bestimmen, welches Datum angezeigt werden soll oder ob es sinnvoll ist, überhaupt eines anzuzeigen. Es ist nicht an ein bestimmtes Attribut gebunden.

John Mueller - Twitter

Am wahrscheinlichsten finde ich jedoch, dass Google an folgenden Stellen nach Datumsangaben auf Webseiten sucht:

  • Mit maschinellem Lernen auf der Seite gut sichtbar
  • Schema.org strukturierte Daten, insbesondere wenn die Daten auch auf der Seite sichtbar sind