it-swarm.com.de

Auswahl von Tabellen in PDF

In Adobe Acrobat unter Windows gibt es ein Tool zum Auswählen von Tabellen, mit dem ich Tabellen zum Ausschneiden und Einfügen in Word auswählen kann. Ich möchte jetzt auf Ubuntu Tabellen aus PDFs in OpennOffice ausschneiden und einfügen, aber es gibt kein ähnliches Tool. Gibt es eine Möglichkeit, evince dazu zu bringen, oder ein anderes Programm, das dieses Tool enthält? Ich habe mir auch pdfedit und xpdf angesehen, aber keinen Erfolg.

5
Kathryn Weber

Dies ist zwar nicht genau das, wonach Sie fragen, aber es kann hilfreich sein, die Tabellendaten aus dem PDF abzurufen, die Sie dann formatieren und in anderen Dokumenten verwenden können.

Sie können das kostenlose Textauswahl-Tool von Adobe Acrobat Reader und die gnumerische Tabellenkalkulation verwenden. Beide Anwendungen können über die Repositorys installiert werden. Aktivieren Sie für Adobe Acrobat Reader einfach das Partner-Repository in Synaptic oder Software Center.

Öffnen Sie Ihr PDF mit Acrobat Reader und kopieren Sie den Text im Tabellenbereich mit dem Textauswahl-Werkzeug. Dieses Werkzeug finden Sie unter Extras> Auswahl & Zoom-Menü. Sie können die Strg- und Alt-Taste auf Ihrer Tastatur gedrückt halten Wenn dieses Werkzeug ausgewählt ist und Sie Textblöcke auswählen können, haben Sie eine gute Kontrolle über die Auswahl.

Starten Sie gnumeric, wählen Sie eine Zelle aus und klicken Sie in der Symbolleiste auf die Schaltfläche Einfügen. Ihnen wird das Dialogfeld "Konfiguration für Textimport" angezeigt. Oft müssen Sie in diesem Dialogfeld nicht viel ändern. In der Regel möchten Sie, dass der ursprüngliche Datentyp auf "Getrennt" festgelegt wird. Klicken Sie auf die Weiter-Schaltfläche und überprüfen Sie Ihr Trennzeichen (normalerweise Leerzeichen).

schauen Sie unten nach und prüfen Sie, ob die Struktur in Ordnung ist. Dann können Sie Finish auswählen. gnumeric platziert den kopierten Text ordentlich in die Tabelle und erstellt die Tabelle dort für Sie neu.

Die Tabelle kann jetzt von gnumeric kopiert und in Ihr Openoffice.org-Writer-Dokument eingefügt werden, oder Sie können zuerst von gnumeric in calc einfügen und dann formatieren. Anschließend müssen Sie die formatierte Calc-Tabelle nur noch in writer kopieren und einfügen.

Wenn die Tabellen komplex sind und Text in die Überschriften eingeschlossen haben, können Sie die Überschriften zuerst einzeln oder in der gesamten Zeile kopieren, sie einfügen und in gnumerisch korrigieren, dann den Datenabschnitt kopieren und unter den Überschriften einfügen.

Dies mag ein bisschen lang erscheinen, ist aber viel besser als das erneute Eingeben der Daten oder das direkte Einfügen von Text in ein Textverarbeitungsprogramm, das oftmals mühsames Bearbeiten erfordert, um gut auszusehen.

Wenn Ihnen eine Bitmap-Tabelle nichts ausmacht, können Sie mit dem Schnappschuss-Werkzeug in Adobe Acrobat Reader den Tabellenbereich auswählen und in Ihr Textverarbeitungsprogramm einfügen. Dies funktioniert in vielen Fällen, wenn Sie die Tabelle nicht bearbeiten möchten.

1
Sabacon

Ich würde den Industriestandard für PDF Tabellenextraktion ist Tabula

https://github.com/tabulapdf/tabula

0
mirh

Sie können Acroread auch auf Ihrem System installieren und alle Funktionen der Software ausführen.

http://get.Adobe.com/uk/reader/

In synaptic fügen Sie die nächsten Software-Quellen ein:

deb http://archive.canonical.com/ubuntu maverick partner
deb-src http://archive.canonical.com/ubuntu maverick partner

Öffnen Sie dazu "System/Administration/Synaptic Package Manager" (geben Sie bei Bedarf Ihr Passwort ein).

In Synaptic gehen Sie zu Einstellungen/Repositories und klicken Sie auf die Registerkarte "Andere Software" und Sie erhalten ein Fenster wie dieses:

enter image description here

Klicken Sie auf die Schaltfläche "Hinzufügen" und geben Sie die zuvor von mir bereitgestellten Softwarequellen zeilenweise ein.

enter image description here

Wenn Sie fertig sind, führen Sie eine Aktualisierung durch, indem Sie auf die Schaltfläche "Neu laden" klicken oder den nächsten Befehl in einem Terminal ablegen. (HINWEIS: Dieser Befehl kann nur ausgeführt werden, wenn Synaptic Package Manager geschlossen ist.)

Sudo apt-get update

Führen Sie dann erneut eine synaptische Suche nach "acroread" durch und markieren Sie diese für die Installation. Übernehmen Sie die Änderungen und genießen Sie.

HINWEIS: Wenn Sie sich für die Installation mit dem Terminal entschieden haben, fügen Sie die Repositorys einfach zu den Softwarequellen hinzu, schließen Sie synaptic und führen Sie das nächste in einem Terminal aus:

Sudo apt-get install acroread