it-swarm.com.de

Wie finde ich heraus, wann eine Webseite zuletzt aktualisiert wurde?

Gibt es eine Möglichkeit herauszufinden, wie viel Zeit vergangen ist, seit eine Webseite geändert wurde?

Zum Beispiel Ich habe eine Seite, die gehostet wird unter: www.mywebsitenotupdated.com

Gibt es eine Möglichkeit, herauszufinden, wann diese HTML-Seite auf den Server hochgeladen wurde?

Sehr wichtig, ich habe keinen Zugang zum Server; Nur ein Link zur Webseite.

63
guisantogui

Nein, Sie können nicht wissen, wann eine Seite zuletzt aktualisiert oder zuletzt geändert oder auf einen Server hochgeladen wurde (dies kann je nach Interpretation drei verschiedene Ursachen haben), wenn Sie nur auf die Seite zugreifen.

Ein Server kann und sollte (gemäß dem HTTP 1.1-Protokoll) einen Last-Modified-Header senden, den Sie auf verschiedene Weise herausfinden können, z. mit Rex Swains HTTP Viewer . Laut Protokoll handelt es sich jedoch nur um "das Datum und die Uhrzeit, zu dem der Origin-Server der Meinung ist, dass die Variante zuletzt geändert wurde". Das Protokoll fügt realistisch hinzu: „Die genaue Bedeutung dieses Headerfelds hängt von der Implementierung des Origin-Servers und der Art der ursprünglichen Ressource ab. Bei Dateien kann es sich nur um das zuletzt geänderte Dateisystem handeln. Bei Entitäten mit dynamisch eingeschlossenen Teilen kann es sich um die jüngste der letzten Änderungszeiten für ihre Komponententeile handeln. Bei Datenbank-Gateways kann es sich um den Zeitstempel der letzten Aktualisierung des Datensatzes handeln. Bei virtuellen Objekten kann es sein, dass sich der interne Zustand zuletzt geändert hat. “

In der Praxis werden Webseiten häufig aus einem Content-Management-System oder aus anderen Gründen dynamisch erstellt. In solchen Fällen zeigt der Last-Modified-Header normalerweise einen Datenstempel zum Erstellen der Antwort, der normalerweise sehr nahe am Zeitpunkt der Anfrage liegt. Dies bedeutet, dass der Header in solchen Fällen praktisch unbrauchbar ist.

Selbst bei einer "statischen" Seite (der Server holt einfach eine der Anfrage entsprechende Datei und sendet diese), zeigt der Last-Modified-Datumsstempel normalerweise nur den letzten Schreibzugriff auf die Datei auf dem Server an. Dies kann sich auf einen Zeitpunkt beziehen, zu dem die Datei von einer Sicherungskopie wiederhergestellt wurde, oder auf einen Zeitpunkt, zu dem die Datei auf dem Server bearbeitet wurde, ohne dass der Inhalt geändert wurde, oder auf einen Zeitpunkt, zu dem sie auf den Server hochgeladen wurde, wodurch möglicherweise eine ältere ersetzt wurde identische Kopie. In diesen Fällen wird unter der Annahme, dass der Zeitstempel technisch korrekt ist, eine Zeit angegeben, nach der die Seite nicht geändert wurde (aber nicht unbedingt der Zeitpunkt der letzten Änderung).

64

Öffnen Sie die Browserkonsole ( ? ) und geben Sie Folgendes ein:

javascript:alert(document.lastModified)
49
Vaux42

Es gibt einen anderen Weg, um das Seiten-Update zu finden, was für einige Anlässe nützlich sein könnte (falls es funktioniert :). 

Wenn die Seite von Google oder von Wayback Machine indexiert wurde, können Sie herausfinden, welches Datum bzw. die Daten von ihnen gespeichert wurden (diese Methoden funktionieren für keine Seite und haben einige Einschränkungen.) welche in diesem webmasters.stackexchange ausführlich recherchiert werden die Antworten der Fragen , aber in vielen Fällen können sie Ihnen helfen, die Aktualisierungsdaten der Seite herauszufinden:

  1. Google-Methode: Gehen Sie über den Link https://www.google.com.ua/search?q=site%3Awww.example.com&biw=1855&biq=916&source=lnt&tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000% 2Ccd_max% 3A & tbm =
    • Sie können den Text im Suchfeld durch eine beliebige Seiten-URL ändern.
    • Zum Beispiel: die aktuelle Stackoverflow-Fragenseite search gibt uns als Ergebnis 14. Mai 2014 - Dies ist das Erstellungsdatum der Frage:  enter image description here
  2. Wayback Machine Way: Gehen Sie über den Link https://web.archive.org/web/*/www.example.com
    • für diese stackoverflow-Seite wayback machine gibt uns weitere Ergebnisse: Saved 6 times between June 7, 2014 and November 23, 2016., und Sie können alle gespeicherten Kopien für jedes Datum anzeigen
9
hooke

Zum Überprüfen des Last Modified-Headers können Sie httpie ( docs ) verwenden.

Installation

pip install httpie --user

Verwendungszweck

$ http -h https://martin-thoma.com/author/martin-thoma/ | grep 'Last-Modified\|Date'
Date: Fri, 06 Jan 2017 10:06:43 GMT
Last-Modified: Fri, 06 Jan 2017 07:42:34 GMT

Die Variable Date ist wichtig, da hier die Serverzeit und nicht Ihre Ortszeit angegeben wird. Außerdem sendet nicht jeder Server Last-Modified (z. B. scheint Superuser das nicht zu tun).

4
Martin Thoma

ein pythonischer Weg, dies von https://Gist.github.com/EronHennessey/6996195 zu tun

import httplib
import yaml
c = httplib.HTTPConnection(address)
c.request('GET', url_path)
r = c.getresponse()
# get the date into a datetime object
lmd = r.getheader('last-modified')
if lmd != None:
   cur_data = { url: datetime.strptime(lmd, '%a, %d %b %Y %H:%M:%S %Z') }
else:
   print "Hmmm, no last-modified data was returned from the URL."
   print "Returned header:"
   print yaml.dump(dict(r.getheaders()), default_flow_style=False)

der Rest des Skripts enthält ein Beispiel für das Archivieren einer Seite und das Prüfen auf Änderungen gegenüber der neuen Version sowie das Benachrichtigen von Personen per E-Mail. 

0
Marc Maxmeister

Ich habe dazu einen Blog geschrieben, der einige einfache Schritte zum Überprüfen des Datums und der Uhrzeit Ihrer zuletzt aktualisierten Website zeigt . https://sachinapatel.wordpress.com/ Sie können es überprüfen der erste blogpost

0
sapatel93