Es gibt schon einiges im Bereich der OCR-Anwendungen, von kostenlos, open source bis hin zu richtig teuer ist alles dabei. Welche Anwendung zu einem passt, entscheidet der Anspruch, das Vorhaben und letztlich auch das Ergebnis.

Geht es nur darum, einfach den Text ohne Layout und Formatierung zu erkennen kommt man günstiger bei weg, als wenn mehr erwartet bzw. verlangt wird.

Bei vielen OCR-Anwendungen oder -Suiten geht es primär um PDF, das ist wenig verwunderlich, da häufig direkt vom Scanner ins PDF-Format übertragen wird und vieles ebenfalls per PDF durch die Weltgeschichte geschickt wird, leider oft ohne das diese durchsuchbar oder Textstellen kopierbar sind.

Manchmal geht es aber auch um vorhandene Bilder, bei denen mittels OCR der Text ausgelesen und ggf. weiter verarbeitet werden soll.

Beim Rumspielen mit FreeOCR, IrfanView mit KADMOS Plugin, EASY SCREEN OCR waren die Ergebnisse nicht so wie erwartet und gewünscht. Wobei man fairerweise sagen muss, das beim letztgenannten der Schwerpunkt auf die Anwendung in Verbindung mit Screenshots und Bilder liegt, dabei wird nur der Text ermittelt.

Nach etwas suchen und probieren kam ich letztlich bei Readiris an.

Los geht’s mit der kleinsten Version für 49,00 € über die Pro-Variante für 99,00 € bis hin zur Corporate-Ausgabe für 199,00 €.

Was kostet Readiris 17? (inkl. Versionsvergleich)

Für den Einstieg gibt’s eine Menge Tutorials als Video.

Das Programm kann allerdings noch mehr, als mit PDFs arbeiten und per OCR Texte erkennen. Ein Beispiel wäre die Umwandlung von Text zu Sprache.

Die 10-Tage-Demoversion kann direkt heruntergeladen werden, man muss nicht über das Formular gehen.

Im Gegensatz zu so manch anderen Kandidaten wurden beim Test z.B. deutsche Umlaute erkannt, ferner wird z.B. beim Umwandeln zu Word- oder OpenDocumentText-Datei (ab Pro) auch das Layout “mitgenommen”.

Im Schnitt dürfte (imho) die Pro-Variante am interessantesten sein.