it-swarm.com.de

Wie erhalte und speichere ich Wordpress-Inhalte (HTML, CSS, Bilder, Videos) aus einem Java-Programm?

Ich entschuldige mich, wenn es nicht der richtige Ort ist, um diese Frage zu stellen. Bitte, wenn es mir nicht hilft, herauszufinden, wo ich danach fragen muss.

Also hier ist meine Herausforderung. Ich muss WordPress-Inhalte (HTML, CSS, Bilder und Videos) aus einem Java-Programm herunterladen und speichern.

          HTML, images, CSS
WordPress -----------------> File system

Dann möchte ich diesen Inhalt analysieren, um die Seiten in meine vorhandene Spring-Webanwendung zu integrieren. Zum Beispiel bedeutet es, dass

http://localhost/wp-content/image1.png

wird sich ändern müssen in

http://localhost/spring/image1.png

in meine Spring Bewerbung eingearbeitet.

Ich habe bisher über viele Möglichkeiten nachgedacht. Ich würde gerne Ihr Feedback erhalten und andere Lösungen vorschlagen, über die ich nicht nachgedacht habe.

  1. Verwenden Sie dieses kleine Java-Programm wget , um den gesamten Inhalt von der WordPress-Site abzurufen und dann zu speichern. Pros : Es ist sicher, dass es das Ziel seiner Wget sein wird, Site Mirrors zu erstellen. Nachteile : Links funktionieren in meiner Spring-Anwendung nicht und ich muss die HTML- und CSS-Codes trotzdem analysieren.

  2. Verwenden Sie jsoup . Vorteile : Als Parser kann ich die URL direkt ändern, um sie in meine Spring-Anwendung zu integrieren. Nachteile : Es ist nicht sicher, ob der Inhalt auf der Festplatte gespeichert werden kann.

  3. Verwenden Sie ein WordPress-Plugin, um Seiten zu exportieren. Vorteile : Nur Seiten, die sich auf die aktuelle Änderung beziehen, werden auf der Festplatte gespeichert (es ist möglich, einen Ordner anzugeben). Nachteile : Es ist nicht in Java (ich kann das Plugin nicht warten). Wie auch immer, ich muss den Zielordner beobachten und jedes Mal, wenn sich eine Datei ändert, muss ich ihn neu analysieren, um die Links zu ändern, damit er in meiner Frühjahrsanwendung funktioniert.

Ich habe keine anderen Lösungen gefunden und all diese Lösungen sind ziemlich schlecht. Denken Sie über andere Möglichkeiten nach, dies zu tun?

Danke für deine Hilfe.

1
Clemzd

Ich kann meine eigene Frage beantworten. Jsoup kann tun, was ich brauche:

  1. Inhalt extrahieren (getestet)
  2. Ändern Sie den Link für Frühling (getestet)
  3. Speichern von HTML (getestet), Bildern (getestet), Videos (noch nicht getestet)
1
Clemzd