it-swarm.com.de

Bestraft Google täglich aktualisierte <lastmod> -Tags in Sitemaps, wenn die Daten nicht täglich aktualisiert werden?

Ich habe eine Sitemap, die täglich mit vielen Links zu Produktseiten erstellt wird. Diese Produkte werden täglich aus einer anderen Datenquelle importiert. Da das Update darin besteht, alle aktuellen Produktinformationen zu verwerfen und durch die neu importierten Informationen zu ersetzen, springt das Datum der letzten Änderung immer um einen Tag. Dies wird auch in der Sitemap verwendet. Auch für Produkte, die sich nicht geändert haben. Alle Produktseiten geben vor, aktualisiert worden zu sein.

Wird Google die Website dafür bestrafen, dass sie so getan hat, als ob sie sich von Tag zu Tag geändert hätte?

Meine Lösung wäre, den Eintrag nur zu ändern, wenn die neu importierten Produktdaten von den vorherigen Daten abweichen. Ich möchte nur sicherstellen, dass dies ein nützliches Upgrade ist, während ich meine Zeit auch für andere Verbesserungen verwenden kann.

9
Elicit

Ich habe noch nie etwas von einer Strafe gehört. Im schlimmsten Fall verschwenden Sie die Zeit der Spinne, aber das ist ein Grund, warum wir überhaupt Computer haben: langweilige, sich wiederholende Dinge. Trotzdem, Sie sollten sprechen das Problem im Idealfall an.

Diese...

Meine Lösung wäre, den Eintrag nur zu ändern, wenn die neu importierten Produktdaten von den vorherigen Daten abweichen.

... sollten Sie zuerst tun, unabhängig von externen Überlegungen wie Sitemaps usw. Wenn sich Ihre Inhalte nicht unterscheiden (und ich würde das Löschen und Ersetzen durch identische Informationen in dieser Beschreibung einschließen), dann ist Ihr lastmod Datum sollte nicht geändert werden. Hier verschwenden Sie Ihre eigenen Ressourcen. Sie haben nicht gesagt, wie viele Produkte betroffen sind, aber es wird einen Punkt geben, an dem dieser Prozess langsam und rechenintensiv wird.

5
Su'

Ich habe die Idee, jeden Tag <lastmod> zu aktualisieren, nie gemocht, da dies nicht nur falsch, sondern auch irreführend ist.

In einem Beitrag auf SO schrieb Gary Illyes von Google:

Das lastmod -Tag ist in Sitmaps optional und wird in den meisten Fällen von Suchmaschinen ignoriert, da Webmaster schreckliche Arbeit leisten, um die Genauigkeit zu gewährleisten.

Ich habe allgemein dafür plädiert, entweder <lastmod> richtig zu verwenden oder überhaupt nicht. Wenn Sie diese Option deaktivieren (sowie <changefreq> & <priority>), wird die Datei selbst sogar kleiner und kann auch von Suchmaschinen schneller gelesen werden.

3
Andrew Lott

Ich arbeite nicht für Google und kann nicht genau sagen, was sie tatsächlich tun, aber die vernünftige Methode, mit <lastmod> timestamps umzugehen, wäre als Hinweis, keine Zeit mit dem erneuten Crawlen von Seiten zu verschwenden, die nicht geändert haben.

Wenn Sie also jeden Tag alle Ihre Seiten als geändert melden, durchsucht Googlebot alle Ihre Seiten in beliebiger Reihenfolge, anstatt sich nur auf die geänderten Seiten zu konzentrieren. Tatsächlich ist es so, als ob Sie überhaupt keine Zeitstempel für die letzte Änderung gemeldet hätten.

Der Hauptgrund für die Angabe korrekter <lastmod>-Zeitstempel besteht darin, dass Änderungen an Ihrer Website im Google-Index schneller angezeigt werden. Wenn Ihre Website Hunderte von Seiten enthält, wird es eine Weile dauern, bis Google alle crawlt und Änderungen feststellt. Wenn Sie Googlebot jedoch mitteilen, welche Seiten in letzter Zeit geändert wurden, können diese Seiten zuerst gecrawlt werden, und es wird nicht so viel Zeit für den Rest verschwendet.

Natürlich können Sie auch einfach die Crawling-Rate von Googlebot erhöhen in den Webmaster-Tools auswählen und auf das Beste hoffen. Es sollte jedoch nicht allzu schwierig sein, Zeitstempel in Ihrem Update-Skript beizubehalten. Zum Beispiel nehme ich an, dass Sie gerade so etwas machen:

for each product do:
    write new page content into product page file;
end do;

Wenn ja, ändern Sie es stattdessen einfach in so etwas:

for each product do:
    read old page content from product page file into string A;
    write new page content into string B;
    if A is not equal to B then:
        write string B into product page file;
    end if;
end do;
2
Ilmari Karonen

Nein, es ist einfach ignoriert die Informationen Sie haben angegeben, wenn es falsch ist. In diesem Fall stellen Webcrawler selbst fest, wie oft sie Ihre Seiten crawlen sollen.

2

Nein. Google verwendet lastmod als Hinweis (wie alle Sitemap-Werte). Wenn jedoch entschieden wird, dass Ihr Inhalt nicht täglich aktualisiert wird, wird er einfach ignoriert und Ihre Seiten werden nach eigenem Zeitplan erneut aufgerufen.

2
DisgruntledGoat

Google wird Sie dafür nicht bestrafen. Um eine Strafe zu bekommen, musst du unbedingt einen schwarzen Hut auf Googles Hintern ziehen. Mach dir also keine Sorgen. Google wird früh genug herausfinden, ob Ihre Inhalte Änderungen aufweisen (daran haben sie in den letzten Jahren gearbeitet), und die lastmod -Eigenschaft als Hinweis verwenden.

1

Ich empfehle Ihnen, dies zu lesen Best Practices für XML-Sitemaps und RSS/Atom-Feeds

Letzte Änderungszeit

Geben Sie für jede URL in einer XML-Sitemap und einem RSS/Atom-Feed einen Zeitpunkt für die letzte Änderung an. Der letzte Änderungszeitpunkt sollte der letzte Zeitpunkt sein, an dem sich der Inhalt der Seite erheblich geändert hat. Wenn eine Änderung in den Suchergebnissen sichtbar sein soll, sollte der Zeitpunkt der letzten Änderung der Zeitpunkt dieser Änderung sein.

XML sitemap uses  <lastmod>
RSS uses <pubDate>
Atom uses <updated>

Achten Sie darauf, die letzte Änderungszeit korrekt einzustellen oder zu aktualisieren:

Specify the time in the correct format: W3C Datetime for XML sitemaps, RFC3339 for Atom and RFC822 for RSS.
Only update modification time when the content changed meaningfully.
Don’t set the last modification time to the current time whenever the sitemap or feed is served.
1
John