it-swarm.com.de

PDF aus HTML-Buch erstellen

Es gibt einige Websites, die Bücher als HTML-Seiten bereitstellen (z. B. rechtliche Informationen).

Womit kann ich aus diesen Seiten ein PDF Buch erstellen, das auf der bereits vorhandenen Struktur basiert?

In Windows gibt es Adobe Professional (kommerzielle Software). Ich vermute, dass Linux etwas frei hat? Eine Lösung mit Skripten wäre für mich in Ordnung.

16
Lucian Sasu

Calibre ist ein ziemlich leistungsfähiges Tool zum Konvertieren von Dingen in E-Books in verschiedenen Formaten. Erhältlich in einem Software Center in Ihrer Nähe!

Lassen Sie sich nicht von der weniger als schönen Benutzeroberfläche täuschen, sie kann viel bewirken.

9
Oli

Der einfachste Weg? Datei> Drucken über Ihren Browser. Wählen Sie Print to File als Ihren Drucker, und Sie werden gefragt, wo Sie ihn haben möchten. Stellen Sie sicher, dass Sie PDF markieren. Klicken Sie auf "Drucken" und es wird tatsächlich auf Ihrem Laufwerk gespeichert, anstatt tatsächlich zu drucken.

4
Jacob Peddicord

Htmldoc kann nützlich sein, siehe hier; http://www.htmldoc.org/ es ist im Software-Center erhältlich, leider hat die 1.8-Version ein Problem mit Unicode-kodierten Dateien, aber in vielen Fällen kann es immer noch ein Retter sein, das Problem ist behoben in der 1.9 Entwicklungsversion.

Normalerweise benutze ich hier die wundervolle Erweiterung für das Sammelalbum. http://amb.vis.ne.jp/mozilla/scrapbook/ Damit Firefox die Webseiten aufzeichnet, verwenden Sie die Bearbeitungstools in Scrapbook, um sie zu reparieren, wenn dies erforderlich ist, und verwenden Sie dann htmldoc für konvertieren Sie alle Seiten in PDF.

4
Sabacon

Ich würde empfehlen, OpenOffice/LibreOffice zu verwenden, um das PDF zu erstellen. Als Test habe ich das Wget-Manul heruntergeladen (alles auf einer Seite) und dann die HTML-Seite in OponOffice geöffnet und auf die Schaltfläche "Direkt in PDF exportieren" geklickt. Es erstellte das PDF mit einem Index aus dem Inhaltsverzeichnis.

In der Vergangenheit habe ich festgestellt, dass dies der einfachste Weg ist, HTML-Seiten in PDF umzuwandeln. Sie können damit auch ohne großen Aufwand Änderungen vornehmen.

Screenshots:

  • Wget-Handbuch mit Open Office nach PDF exportiert Wget manual exported to PDF using Open Office

  • Option Direkt nach PDF in Open Office exportieren Export Directly to PDF option in Open Office

3
SiliconChaos

Sie könnten versuchen http://www.xhtml2pdf.com/ . Es ist ein Konverter für HTML/XHTML und CSS in PDF. Alles in Python geschrieben.

3
Nichod

Abhängig vom zu druckenden HTML-Dokument erzielen Sie möglicherweise die besten Ergebnisse mit pandoc . Dies ist einer der vielseitigsten HTML-zu-LaTeX-Konverter. Die resultierende .tex Datei kann ziemlich einfach in PDF umgewandelt werden mit xelatex oder pdflatex. Viele Optionen stehen zur Verfügung, wenn Sie sich mit LaTeX-Syntax und -Paketen befassen möchten. Dies funktioniert möglicherweise nicht richtig, wenn eingebettete Bilder und ausgefallene HTML-Stile beibehalten werden sollen.

2
loevborg

Ich habe tatsächlich für die Kaliberlösung gestimmt. Aber hier ist eine andere, die Sie versuchen könnten. Installieren Sie AbiWord . Es kann Konvertierungen zwischen allen Formaten durchführen, die es von der Befehlszeile kennt. So konvertieren Sie alle HTML-Dateien in einem Ordner in PDF-Dateien:

for file in *.html ; do abiword --to=pdf "$file" ; done

Für eine übergeordnete Typografie (die jedoch wahrscheinlich komplizierter ist) wäre eine andere Option PrinceXML .

2
frabjous

In google-chrome können Sie eine PDF-Datei für eine ganze Site erstellen, indem Sie eine Erweiterung verwenden. Ich persönlich benutze die Web2PDF Converter-Erweiterung , die ein PDF mit nur einem Klick erzeugt.

Hier ist ein Screenshot dieses Plugins von der Google Extensions-Website.

enter image description here

Außerdem können Sie ein von mir mit diesem Tool erstelltes PDF anzeigen, indem Sie das nächste herunterladen (Rechtsklick, Ziel speichern unter): http://geppettvs.servehttp.com/resources/askubuntu -com.pdf (Einige Browser wie google-chrome ermöglichen es Ihnen, dies online zu sehen.).

Und wenn Sie die von der Erweiterung erstellten PDFs bearbeiten möchten, um die von der Erweiterung im unteren Bereich jeder Seite platzierte digitale Signatur zu entfernen, oder um etwas anderes zu entfernen, sehen Sie sich Folgendes an: Entfernen von Textinformationen von a PDF?

Viel Glück!