it-swarm.com.de

Wie kann ich die Sprache angeben, die Tesseract bei der Verwendung von OCRFeeder verwenden soll?

Ich benutze das OCR-Dienstprogramm von OCRFeeder. OCRFeeder verwendet die tesseract - Engine. Ich habe die verschiedenen Sprachpakete installiert, die für tesseract benötigt werden. Wie kann ich die Sprache so einstellen, dass Tesseract die richtige Sprachdatei zum Konvertieren des gescannten Dokuments in Text verwendet?

6
Bernard Decock

Sie müssen die Engine-Befehlszeile in den OCR Feeder-Einstellungen einrichten. Es sollte so aussehen:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Dabei ist lang_id die ID, die auf dem entsprechenden Sprachpaketnamen angegeben ist.

4
João Pinto