it-swarm.com.de

Abrufen der Wortzahl eines PDF-Dokuments in Evince

Gibt es eine Möglichkeit, die Wortzahl eines PDF Dokuments zu ermitteln, das ich in Evince, Ubuntus Standard-PDF-Viewer, ansehe? Ich kann die Dokumente in Textdateien konvertieren und die Wortzahl vom Terminal abrufen, möchte sie jedoch schnell erreichen, ohne das Terminal verwenden zu müssen. Gibt es ein Plugin, das das kann, oder ist es bereits eingebaut und ich vermisse es einfach?

P.S. Ich würde es vorziehen, meinen Viewer nicht zu ändern, da Evince der Standard-Viewer für PDF in Ubuntu ist, und ich würde gerne so viel wie möglich mit den Standardanwendungen machen, da viele von ihnen, einschließlich Evince, sind wirklich nett.

21
user2405

Eine Antwort von Olaf Leidinger auf die Evince-Mailingliste:

Ich denke, eine solche Funktion ist besser für Dokumenteditoren geeignet, da sie als einfacher Betrachter mehr Informationen über das Dokument haben und das Zählen von Wörtern trivial ist. Nehmen Sie als Beispiel eine PDF -Datei. Was Sie als Text sehen, könnte tatsächlich eine Art Vektorgrafikform sein. Selbst wenn der Text als solcher in der Datei PDF enthalten ist, können die angezeigten Wörter aus mehreren "Text an Position (y, x) zeichnen" - Befehlen - z. Bei Umlauten oder Zeilenende. Ein einzelnes Wort kann also als mehrere Wörter gelten. Daher denke ich, dass es schwierig sein könnte, eine solche Funktion zuverlässig zu implementieren. Schauen Sie sich pdftotext an, um zu sehen, was ich meine.
10
user2405

Sie können dies über die Befehlszeile tun:

pdftotext filename.pdf - | tr -d '.' | wc -w
29
Sid

Wie wäre es mit einem schnellen Bash-Skript, das zenity und evident erfordert. Wenn es ohne Argument aufgerufen wird, wird ein Dialogfeld angezeigt, in dem Sie eine Datei auswählen können. Bei Aufruf mit einem Argument (oder nach diesem Dialogfeld) wird sowohl die Datei geöffnet als auch ein Dialogfeld mit einer Wortanzahl angezeigt.

Mit anderen Worten, kopieren Sie Folgendes in eine Textdatei mit dem Namen evince-Word-count.sh oder so, speichern Sie sie irgendwo in Ihrem Pfad (z. B. ~/bin/) und machen Sie sie ausführbar (entweder über Nautilus 'Rechtsklick und Eigenschaften oder mit chmod +x ~/bin/evince-Word-count.sh),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename="$1"
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

Klicken Sie nun mit der rechten Maustaste auf ein bestimmtes PDF in Nautilus, wählen Sie "Öffnen mit ..." und lassen Sie es dann mit evince-Word-count.sh öffnen. Wenn Sie jetzt eine PDF-Datei öffnen, werden beide geöffnet, und Sie erhalten eine Word-Zählung.

alt text

9
frabjous

Ich glaube nicht, dass das möglich ist (nun, es ist technisch möglich, wurde aber nicht implementiert).

Sie müssen sich daran erinnern, dass Evince ein Dokumentbetrachter ist und eine Wortanzahl eine Funktion ist, die normalerweise in einem Editor erforderlich ist (ja, ich weiß, dass dies nicht immer der Fall ist).

Vielleicht möchten Sie wenden Sie sich an die Evince-Entwickler und fragen, ob sie Interesse an der Implementierung dieser Funktion haben.

4
8128