it-swarm.com.de

Wiederherstellen einer verlorenen Website ohne Backup?

Leider ist bei unserem Hosting-Anbieter ein Datenverlust von 100% aufgetreten. Daher habe ich den gesamten Inhalt für zwei gehostete Blog-Websites verloren:

(Ja, ja, ich habe absolut sollte vollständige Offsite-Sicherungen durchgeführt. Leider befanden sich alle meine Sicherungen auf dem Server selbst. Speichern Sie den Vortrag, Sie haben 100% Recht. Aber das hilft mir im Moment nicht weiter. Konzentrieren wir uns hier auf die Frage!)

Ich beginne den langsamen, schmerzhaften Prozess der Wiederherstellung der Website von Webcrawler-Caches.

Es gibt einige automatisierte Tools zum Wiederherstellen einer Website aus Internet-Web-Spider-Caches (Yahoo, Bing, Google usw.), z. B. Warrick , aber mit diesen Tools konnte ich einige schlechte Ergebnisse erzielen:

  • Meine IP-Adresse wurde von Google schnell für die Verwendung gesperrt
  • Ich bekomme viele 500 und 503 Fehler und "warte 5 Minuten ..."
  • Letztendlich kann ich den Textinhalt schneller von Hand wiederherstellen

Ich hatte viel mehr Glück, indem ich eine Liste aller Blog-Beiträge verwendet, in den Google-Cache geklickt und jede einzelne Datei als HTML gespeichert habe. Obwohl es viele Blog-Posts gibt, gibt es nicht viele dass , und ich schätze, ich verdiene eine Selbstkennzeichnung, weil ich keine bessere Backup-Strategie habe. Auf jeden Fall ist wichtig, dass ich viel Glück hatte, den Blogpost-Text auf diese Weise zu erhalten, und ich bin definitiv in der Lage, den Text der Webseiten aus den Internet-Caches zu holen. Basierend auf dem, was ich bisher getan habe, Ich bin zuversichtlich, dass ich all den verlorenen Blogpost-Text und die verlorenen Kommentare wiederherstellen kann.

Allerdings erweisen sich die zu jedem Blog-Beitrag gehörenden images als… schwieriger.

Allgemeine Tipps zum Wiederherstellen von Websiteseiten aus Internet-Caches und insbesondere Stellen zum Wiederherstellen von archivierten Bildern von Websiteseiten?

(Und noch einmal, bitte, keine Backup-Vorlesungen. Sie haben vollkommen vollkommen recht! Aber Recht zu haben, löst nicht mein unmittelbares Problem ... Es sei denn, Sie haben eine Zeitmaschine ...)

262
Jeff Atwood

Hier ist mein wilder Stich im Dunkeln: Konfigurieren Sie Ihren Webserver so, dass er für jede Bildanforderung 304 zurückgibt, und stellen Sie dann die Wiederherstellung per Crowd-Source bereit, indem Sie eine Liste von URLs irgendwo posten und im Podcast alle Ihre Leser auffordern, jede URL zu laden und alle Bilder zu sammeln die aus ihren lokalen Caches geladen werden. (Dies kann nur funktionieren, nachdem Sie die HTML-Seiten selbst wiederhergestellt haben, einschließlich der <img ...> -Tags, was zu bedeuten scheint, dass Sie dazu in der Lage sind.)

Dies ist im Grunde eine ausgefallene Art zu sagen: "Holen Sie es sich aus den Webbrowser-Caches Ihrer Leser." Sie haben viele Leser und Podcast-Zuhörer, sodass Sie effektiv eine große Anzahl von Personen mobilisieren können, die Ihre Website wahrscheinlich in letzter Zeit angesehen haben. Das manuelle Finden und Extrahieren von Bildern aus den Caches verschiedener Webbrowser ist jedoch schwierig, und der gesamte Ansatz funktioniert am besten, wenn es so einfach ist, dass viele Leute es versuchen und erfolgreich sind. So der 304 Ansatz. Alles, was Leser benötigen, ist, dass sie auf eine Reihe von Links klicken und alle Bilder ziehen, die in ihren Webbrowser geladen werden (oder mit der rechten Maustaste klicken und speichern unter usw.) und sie dann per E-Mail an Sie senden oder auf eine hochladen zentraler Ort, den Sie einrichten, oder was auch immer. Der Hauptnachteil dieses Ansatzes besteht darin, dass Webbrowser-Caches nicht so lange zurückliegen. Es ist jedoch nur ein Leser erforderlich, der in den letzten Tagen einen Beitrag aus dem Jahr 2006 geladen hat, um selbst ein sehr altes Bild zu retten. Mit einem ausreichend großen Publikum ist alles möglich.

219
John Siracusa

Einige von uns folgen Ihnen mit einem RSS-Reader und löschen keine Caches. Ich habe Blog-Posts, die auf das Jahr 2006 zurückgehen. Soweit ich sie sehen kann, gibt es keine Bilder, aber sie sind möglicherweise besser als das, was Sie gerade tun.

65
retracile

(1) Extrahieren Sie eine Liste der Dateinamen aller fehlenden Bilder aus den HTML-Sicherungen. Sie werden mit so etwas wie verlassen:

  • stay-puft-Marshmallow-man.jpg
  • internet-properties-dialog.png
  • yahoo-homepage-small.png
  • password-show-animated.gif
  • tivo2.jpg
  • michael-abrash-grafikprogramm

(2) Führen Sie eine Google-Bildsuche nach diesen Dateinamen durch. Es scheint, dass VIELE von ihnen von anderen Bloggern "gespiegelt" wurden und reif für die Aufnahme sind, weil sie den gleichen Dateinamen haben.

(3) Sie können dies auf automatisierte Weise tun, wenn sich dies beispielsweise bei mehr als 10 Bildern als erfolgreich erweist.

62
Portman

Wenn Sie zu Google Bildersuche gehen und site:codinghorror.com eingeben, können Sie zumindest die Miniaturansichten aller Ihrer Bilder finden. Nein, es hilft nicht unbedingt, aber es gibt Ihnen einen Ausgangspunkt für das Abrufen dieser Tausenden von Bildern.

Codinghorror images

Es sieht so aus, als würde Google in einigen Fällen ein größeres Vorschaubild speichern:

Google vs. Bing

Google ist links, Bing rechts.

50
George Stocker

Tut mir leid, von den Blogs zu hören. Ich werde nicht vortragen. Aber ich habe auf Imageshack herausgefunden, was Ihre Bilder zu sein scheinen. Sind sie wirklich deine oder hat jemand eine Kopie von ihnen aufbewahrt?.

http://profile.imageshack.us/user/codinghorror

Sie scheinen 456 Bilder in voller Größe zu haben. Dies könnte die beste Wahl sein, um alles wiederherzustellen. Vielleicht können sie dir sogar eine Müllkippe geben.

40
Nick Berardi

Jeff, ich habe etwas für dich geschrieben hier

Kurz gesagt, was ich Ihnen vorschlage, ist:

  1. Konfigurieren Sie den Webserver so, dass er für jede Bildanforderung 304 zurückgibt. 304 bedeutet, dass die Datei nicht geändert wird. Dies bedeutet, dass der Browser die Datei aus dem Cache abruft, wenn sie dort vorhanden ist. (credit: this SuperUser answer )

  2. Fügen Sie auf jeder Seite der Website ein kleines Skript hinzu, um die Bilddaten zu erfassen und an den Server zu senden.

  3. Speichern Sie die Bilddaten auf dem Server.

  4. Voila!

Sie können die Skripte über den angegebenen Link erhalten.

37
Niyaz

Versuchen Sie diese Abfrage auf der Wayback-Maschine :

http://web.archive.org/web/*sa_re_im_/http://codinghorror.com/*

Dadurch erhalten Sie alle Bilder von codinghorror.com, die von archive.org archiviert wurden. Dies gibt 3878 Bilder zurück, von denen einige Duplikate sind. Es wird nicht vollständig sein, aber trotzdem ein guter Start.

Für die restlichen Bilder können Sie die Miniaturansichten aus einem Suchmaschinen-Cache verwenden und anschließend eine umgekehrte Suche mit diesen unter http://www.tineye.com/ durchführen. Sie geben ihm das Miniaturbild und es gibt Ihnen eine Vorschau und einen Zeiger auf genau passende Bilder, die im Web gefunden wurden.

28
Peter Stuer

+1 auf die Empfehlung dd, wenn (1) die Raw-Festplatte irgendwo verfügbar ist; und (2) die Bilder waren einfache Dateien. Anschließend können Sie mit einem forensischen Tool zur Datenerfassung beispielsweise alle glaubwürdigen Bereiche ermitteln, die als JPGs/PNGs/GIFs erscheinen. Ich habe mehr als 95% der Fotos auf einem iPhone wiederhergestellt, das auf diese Weise gelöscht wurde.

Hierfür können die Open-Source-Tools 'foremost' und sein Nachfolger 'scalpel' verwendet werden:

http://foremost.sourceforge.net/

http://www.digitalforensicssolutions.com/Scalpel/

26
gojomo

Zum Glück werden zukünftige Generationen in Ordnung sein.

Selbst mit nur einem Teil dieses großen Felsens haben Wissenschaftler/Linguisten viel herausgefunden.

Rosetta Stone

Wenn ein paar Bilder fehlen, überlassen Sie es jemandem, dies in ein paar tausend Jahren herauszufinden.

Hoffentlich lachst du ein bisschen. :)

26
jm

Sie können es auch jederzeit mit archive.org versuchen. Verwenden Sie die Wayback-Maschine. Ich habe dies verwendet, um Bilder von meinen Websites wiederherzustellen.

21
Kyle

Im schlimmsten Fall können Sie also nichts wiederherstellen. Verdammt.

Versuchen Sie, die verkleinerten Google zu greifen und sie durch TinEye , die Reverse-Image-Suchmaschine, zu stecken. Hoffentlich sollte es alle Duplikate oder Rehosts greifen, die Leute gemacht haben.

14
Phoshi

Es ist ein langer Schuss, aber Sie könnten überlegen:

  • Veröffentlichen Sie die genaue Liste der fehlenden Bilder
  • crowd-Sourcing des Abrufprozesses über den gesamten Internetcache Ihrer Leser.

Siehe zum Beispiel Nirsoft Mozilla Cache Viewer :

alt text
(Quelle: nirsoft.net )

Es kann schnell jedes "blog.stackoverflow.com" -Bild, das man noch hat, über eine einfache Befehlszeile ausgraben:

MozillaCacheView.exe -folder "C:\Documents and Settings\Administrator\Local Settings\Application Data\Mozilla\Firefox\Profiles\acf2c3u2.default\Cache" 
/copycache "http://blog.stackoverflow.com" "image" /CopyFilesFolder "c:\temp\blogso" /UseWebSiteDirStructure 0

Hinweis: Sie haben die gleichen Cache-Explorer für Chrome .

alt text
(Quelle: nirsoft.net )

(Ich muss Bilder von blog.stackoverflow.com für 15 Tage enthalten haben.)

Und Internet Explorer oder Opera .


Aktualisieren Sie dann die öffentliche Liste, um zu reflektieren, was die Leser in ihrem Cache finden.

14
VonC

In der Vergangenheit habe ich http://www.archive.org/ verwendet, um zwischengespeicherte Bilder aufzurufen. Es ist ein Hit oder Miss, aber es hat für mich funktioniert.
Auch beim Versuch, Fotos wiederherzustellen, die ich auf einer alten Website verwendet habe, ist www.tineye.com großartig, wenn ich nur die Miniaturansichten habe und die Bilder in voller Größe benötige.

Ich hoffe das hilft dir. Viel Glück.

12
Elitist Czar

Dies ist wahrscheinlich nicht die einfachste oder vollständigste Lösung, aber Dienste wie Evernote speichern normalerweise sowohl den Text als auch die Bilder, wenn sie in der Anwendung gespeichert werden. Vielleicht können einige hilfreiche Leser, die Ihre Artikel gespeichert haben, die Bilder speichern und an Sie zurücksenden ?

10
Justin Burdett

Ich habe tolle Erfahrungen mit archive.org gemacht. Auch wenn Sie nicht in der Lage sind, alle Ihrer Blog-Posts von der Site zu extrahieren, werden regelmäßig Snapshots erstellt:

alt text

Auf diese Weise können Sie jede Seite überprüfen und die Blog-Posts anzeigen, die Sie erstellt haben. Mit den Namen aller Beiträge können Sie sie leicht im Cache von Google finden, wenn archive.org sie nicht hat. Das Archiv versucht, Bilder zu speichern, der Google-Cache enthält Bilder, und ich habe meinen Cache in letzter Zeit nicht geleert, damit ich Ihnen bei den neueren Blog-Posts helfen kann :)

10
John T

Haben Sie Ihren eigenen lokalen Browser-Cache ausprobiert? Ziemlich gute Chance, dass einige der neueren Sachen noch da sind. http://lifehacker.com/385883/resurrect-images-from-my-web-browser-cache

(Oder Sie könnten eine Liste aller fehlenden Bilder zusammenstellen und jeder könnte in seinem Cache nachsehen, ob wir die Lücken füllen können.)

8
thijs

Ein Vorschlag für die Zukunft: Ich verwende Windows Live Writer zum Bloggen, und es speichert lokale Kopien von Posts auf meinem Computer und veröffentlicht sie im Blog.

8
Matt Sherman

Ich schlage die Kombination von archive.org und einem Request Anonymizer wie [Tor] [2] vor. Ich schlage vor, Anonymizer zu verwenden, da auf diese Weise jede Ihrer Anfragen eine zufällige IP-Adresse und einen zufälligen Speicherort hat und Sie auf diese Weise vermeiden können, von archive.org (wie Google) für ungewöhnlich viele Anfragen gesperrt zu werden.

Viel Glück, es gibt eine Menge Juwelen in diesem Blog.

7
mirnazim

Vor ungefähr fünf Jahren schlug eine frühe Inkarnation einer externen Festplatte, auf der ich alle meine digitalen Fotos gespeichert hatte, schwer fehl. Ich habe ein Image der Festplatte mit dd erstellt und ein rudimentäres Tool geschrieben, um alles wiederherzustellen, was wie ein JPEG-Bild aussieht. Habe die meisten meiner Fotos dabei.

Die Frage ist also, ob Sie eine Kopie des Images der virtuellen Maschine erhalten können, auf der sich die Images befanden.

7
Sinan Ünür

Das Webarchiv speichert die Bilder im Cache. Momentan ist es unter großer Last. Du solltest bis 2008 oder so in Ordnung sein.

http://web.archive.org/web/20080618014552rn%5F2/www.codinghorror.com/blog/

7
Juan Cruz Nores

Die Wayback-Maschine wird einige haben. Google-Cache und ähnliche Caches haben einige.

Am effektivsten ist es, die Originalposter per E-Mail zu senden und um Hilfe zu bitten.

Ich habe tatsächlich einige infrastrukturelle Empfehlungen, denn danach ist alles aufgeräumt. Das grundlegende Problem sind nicht die Backups, sondern die fehlende Replikation der Site und die mangelnde Überwachung. Wenn Sie mir später eine E-Mail über den Inhalt des privaten E-Mail-Felds senden, wenn Sie wieder auf den Beinen sind, würde ich die Angelegenheit gerne mit Ihnen besprechen.

6
John

Wenn Ihre Bilder auf einem externen Dienst wie Flickr oder einem CDN gespeichert wurden (wie in einem Ihrer Podcasts erwähnt), verfügen Sie möglicherweise noch über die Bildressourcen.

Einige der Bilder finden Sie unter Google Images und klicken Sie auf "Ähnliche Bilder finden" . Möglicherweise befinden sich Kopien auf andere Seiten.

6
splattne

archive.org verbirgt manchmal Bilder. Rufen Sie jede URL manuell ab (oder schreiben Sie ein kurzes Skript) und fragen Sie sie folgendermaßen ab:

string.Format ("GET/*/{0}", nextUri)

Natürlich wird es ziemlich mühsam sein, das zu durchsuchen.

Möglicherweise habe ich einige in meinem Browser-Cache. Wenn ich das tue, werde ich sie irgendwo hosten.

5
Andrew Wilcox

Wenn Sie versuchen möchten, die Caches der Benutzer zu durchsuchen, möchten Sie den Server möglicherweise so einstellen, dass er 304 Not Modified auf alle bedingten GET-Anforderungen ('If-Modified-Since' oder 'If-None-Match') reagiert , welche Browser verwenden, um das zwischengespeicherte Material erneut zu validieren.

Wenn Ihre anfänglichen Caching-Header für statische Inhalte wie Bilder ziemlich umfangreich wären und Dinge tagelang oder monatelang zwischengespeichert werden könnten, könnten Sie einige Zeit lang Anfragen zur erneuten Validierung erhalten. Setzen Sie ein Cookie für diese Anforderungen und fordern Sie die Benutzer auf, ein Skript für ihren Cache auszuführen, um die noch vorhandenen Bilder zu extrahieren.

Beachten Sie jedoch: Sobald Sie anfangen, Textinhalte mit Inline-Ressourcen zu erstellen, die noch nicht vorhanden sind, können Sie diese zwischengespeicherten Versionen löschen, wenn die Revalidatoren 404s erreichen.

4
gojomo

Sie können TinEye verwenden, um Duplikate Ihrer Bilder zu finden durch Durchsuchen der Thumbnails mit Google Cache . Dies hilft jedoch nur bei Bildern, die Sie von einer anderen Website aufgenommen haben.

4
voyager

Ich habe es geschafft, diese Dateien aus meinem Safari-Cache auf Snow Leopard wiederherzustellen:

bad-code-offset-back.jpg
bad-code-offset-front.jpg
code-whitespace-invisible.png
code-whitespace-visible.png
coding-horror-official-logo-small.png
coding-horror-text.png
codinghorror-search-logo1.png
crucial-ssd-128gb-ct128m225.jpg
google-microformat-results-forum.png
google-microformat-results-review.png
kraken-cthulhu.jpg
mail.png
powered-by-crystaltech-web-hosting.png
ssd-vs-magnetic-graph.png

Wenn jemand anderes es versuchen möchte, habe ich ein Python -Skript geschrieben, um sie nach ~/codinghorror/filename zu extrahieren, was hier online gestellt .

Ich hoffe das hilft.

4
Dan Udey

Versuchen Sie Mining der Backups Ihres eigenen Computers für die Images, um auf das Offensichtliche hinzuweisen. Ich weiß, dass meine Sicherungsstrategie so willkürlich ist, dass ich mehrere Kopien vieler Dateien auf externen Laufwerken, gebrannten Datenträgern und in Zip/Tar-Dateien habe. Viel Glück!

4
lo_fye

Hattest du die Chance zu sehen, ob dein Hosting-Provider überhaupt ein Backup hat (einige ältere Versionen)?

3
hi

Wie viel sind Ihnen diese Daten wert? Wenn es einen erheblichen Betrag (mehrere Tausend Euro) wert ist, fragen Sie Ihren Hosting-Anbieter nach der Festplatte, auf der die Daten für Ihre Website gespeichert sind (im Falle eines Datenverlusts aufgrund eines Hardwareausfalls). Sie können dann mit dem Laufwerk den Ontrack oder einen anderen Datenwiederherstellungsdienst ausführen, um zu sehen, was Sie vom Laufwerk abrufen können. Dies ist möglicherweise schwierig zu verhandeln, da möglicherweise auch die nicht wiederhergestellten Daten anderer Personen auf dem Laufwerk gespeichert sind. Wenn Sie sich jedoch wirklich dafür interessieren, können Sie es wahrscheinlich herausfinden.

2
Wedge

Es tut mir sehr leid, das zu hören, und ich bin sehr verärgert über Sie und das Timing. Ich wollte eine Offline-Kopie einiger Ihrer Beiträge und habe HTTrack auf Ihrer gesamten Website ausgeführt, musste aber ausgehen (dies war vor ein paar Wochen) und Ich habe es gestoppt.

Wenn der Host zur Hälfte ausfällt - und ich vermute, Sie sind ein guter Kunde ... Ich würde sie bitten, Ihnen entweder die Festplatten zuzusenden (wie ich vermute, sie sollten RAID verwenden) oder selbst eine Wiederherstellung durchzuführen.

Obwohl dies möglicherweise kein schneller Prozess ist, habe ich dies mit einem Host für einen Client durchgeführt und konnte ganze Datenbanken intakt wiederherstellen (... im Grunde hat der Host ein Upgrade für das verwendete Control Panel versucht und es durcheinander gebracht). aber nichts wurde überschrieben).

Was auch immer passiert - Viel Glück von all deinen Fans auf den SO Seiten!

2
wilhil

Bitten Sie Sun microsystems , Ihre Bilder an Sie zurückzugeben. Sie haben " ein vollständiges Internet-Backup " erstellt. in einem Versandbehälter

"Das Internet Archive bietet eine langfristige digitale Aufbewahrung für das vergängliche Internet", sagte Brewster Kahle, Gründer der Internet Archive-Organisation. "Da immer mehr der wertvollsten Informationen der Welt online verfügbar sind und die Datenmenge exponentiell zunimmt, wird das Internetarchiv eine lebendige Geschichte sein, um sicherzustellen, dass zukünftige Generationen über einen längeren Zeitraum auf diese wichtigen Dokumente zugreifen und sie auch weiterhin aufbewahren können."

Das 1996 von Brewster Kahle gegründete Internet Archive ist eine gemeinnützige Organisation, die eine Bibliothek mit Internetseiten und anderen kulturellen Artefakten in digitaler Form erstellt hat, die bewegte Bilder, Live-Audio-, Audio- und Textformate umfassen. Das Archiv bietet Forschern, Historikern, Wissenschaftlern und der Öffentlichkeit freien Zugang. und bietet auch "The Wayback Machine" - eine digitale Zeitkapsel, mit der Benutzer archivierte Versionen von Webseiten über einen bestimmten Zeitraum hinweg anzeigen können. Ende 2008 umfasste das Internetarchiv mehr als drei Petabty an Informationen, was ungefähr dem 150-fachen der in der Library of Congress enthaltenen Informationen entspricht. Für die Zukunft wird ein Wachstum des Archivs von ca. 100 Terabyte pro Monat erwartet.

alt text
(Quelle: gawker.com )

mehr hier und hier

2
Revolter

Dies ist mein python -Skript. Es durchsucht den Google-Cache und lädt den Inhalt Ihrer Website herunter. Außerdem kann es problemlos mit einem 503 504 404-Fehler ausgeführt werden (Google blockiert IP-Adressen, die viele Anfragen senden): https://Gist.github.com/378779

2
PhamThang

Haben Sie versucht, eine Google Image-Suche mit der Syntax-Site "codinghorror.com" durchzuführen?

1
Norcross

Ich kann alte Beiträge in meinem Google Reader-Konto lesen. Vielleicht hilft das: relating to your horror.

1
Hermen Lesscher

Ich wollte Warrick vorschlagen, weil es von einem meiner CS-Professoren geschrieben wurde. Es tut mir leid zu hören, dass Sie schlechte Erfahrungen damit gemacht haben. Vielleicht kannst du ihm wenigstens eine Nachricht mit einigen Fehlerberichten schicken.

1
David Locke

Ich habe bis zum 30. Juni 2009 Volltext-Einträge für Codinghorror in meinem RSS-Reader, wenn das überhaupt hilft. Senden Sie mir eine E-Mail an jake (at) orty (dot) com. Ich werde sehen, ob ich sie in jedem verwendbaren Format aus dem Newsgator-Posteingang entfernen kann. Möglicherweise sind sie wieder verfügbar (ich muss meine archivierten PST-Dateien ausgraben). Kann nicht mit Bildern helfen, aber es ist ein Anfang (Achselzucken).

(Nevermind: Sieht so aus, als hätten Sie oben viel mehr Optionen, als ich bereitstellen könnte. Entschuldigen Sie den Lärm und markieren Sie sie zum Löschen.)

1
orty

Vielleicht könnten Sie es aus der Crowd-Source-Quelle herunterladen und uns bitten, in unseren Browser-Caches nachzuschauen. Ich lese Coding Horror im Allgemeinen über Google Reader, sodass in meinem Firefox-Cache anscheinend nichts von codinghorror.com enthalten ist.

Andere können in ihrem eigenen Firefox-Cache suchen, indem sie zu: about: cache? Device = disk navigieren.

0
GBegen

Nur ein weiterer Versuch, den Inhalt abzurufen.

Ich habe mich mit dem Feedbrenner angemeldet. Also vielleicht ein paar Archive in meiner Mail! Sie können andere fragen, von wem Sie diese Posts möglicherweise weiterleiten können.

0
Nishant

Das ist mir einmal passiert und ich musste mein WordPress Blog neu erstellen. Ich konnte den gesamten Text aus den Suchmaschinen-Caches wiederherstellen, so wie Sie es tun. Wenn Sie jedoch die Posts neu erstellen, können Sie Ihre eingehenden Links wirklich vermasseln, wenn Sie ihnen nicht die ursprünglichen Permalinks geben. Bilder waren für mich kein großes Problem, da ich sie meist lokal speichere.

0
rsrobbins

Automatisieren Sie einfach das Abrufen der einzelnen Google-Seiten-Cache-Dateien.

Hier ist ein Ruby Skript, das ich in der Vergangenheit verwendet habe.

http://pastie.org/739757

Mein Skript scheint nicht zu schlafen. Ich habe aus irgendeinem Grund keine IP-Sperre erhalten, aber ich würde empfehlen, eine hinzuzufügen.

0
Elliot Temple

Sie könnten versuchen, die kaputte Festplatte vom Hosting-Unternehmen zu beschaffen und sie einem Festplatten-Wiederherstellungsdienst zu übergeben, ich glaube, Sie könnten eine finden. Zumindest die Backup-Images würden wahrscheinlich von dort wiederhergestellt. Auch diese Festplatte könnte Teil eines Spiegel-/RAID-Systems sein und gibt es irgendwo ein Spiegelbild?

0
BobyB

Die meisten Lösungen verwenden eine Kombination aus Blog-Reader-Unterstützung, archive.org und Google-Caching. Ziehen Sie in Betracht, diese Datenkrise in eine Spezifikation für ein Blog-Wiederherstellungstool umzuwandeln. Mehrere in der Frage und den Antworten aufgeführte Funktionen scheinen automatisierbar zu sein, vorausgesetzt, ein Eigentümer verfügt über Kenntnisse über seine Stammwebsite.

  1. Stellen Sie Seiten aus archive.org, dem Google-Cache oder dem lokalen Cache mithilfe von Web-Spider wieder her, wobei bannbare Techniken vermieden werden
  2. Überprüfen Sie den lokalen Cache, die Google-Bildersuche und den Imageshack auf übereinstimmende Dateinamen
  3. Erstellen Sie nach der ersten Wiederherstellung eine Liste der fehlenden Bilder und anderen URLs der Site (z. B. Code 304 für Bilder zurückgeben).
  4. Fügen Sie ein Upload- oder Beitragsformular für Leser hinzu, die Versionen im Cache gespeichert haben
  5. Der Websitebesitzer zeigt eine Vorschau an und validiert Beiträge
  6. Übermitteln Sie die wiederhergestellten Seiten bei Bedarf erneut an Suchmaschinen

Besitzer, die viel Wert auf eine schnelle Wiederherstellung legen, bieten möglicherweise eine Entschädigung für fehlende Dateien oder andere Hilfe von außen an.

0
Matthew Glidden