Wie im Beitrag Windows: Relativ günstiger Einstieg in OCR und mehr erwähnt, wurde mit IrfanView zusammen mit dem KADMOS-Plugin herumgespielt. Dazu nun ein eigener Beitrag zu diesem Lösungsweg in Sachen OCR bzw. Texterkennung.
Für diesen Beitrag wurde die portable Ausgabe von IrfanView verwendet. Das KADMOS-Plugin gibt es zwar “nur” als Setup, dieses kann allerdings einfach mit 7-Zip entpackt und der Inhalt in den Plugin-Ordner von IrfanView eingefügt werden.
Sobald IrfanView gestartet ist kann man entweder direkt von einem Scanner oder bereits vorhandene Bilder geöffnet werden. Die Texterkennung kann über “Optionen – OCR starten (Plugin)” oder einen Druck auf “F9” gestartet werden.
Daraufhin öffnet sich ein neues Fenster in dem zunächst nach Auswahl der Schriftart und Sprache der zu erkennende Text ausgewählt wird. Das Ergebnis sieht dann z.B. wie folgt aus:
Zur Erkennung wurden die ersten zwei Zeilen der eingescannten Windows-Drucker-Testseite ausgewählt. Wie man sieht, ist das Ergebnis “durchwachsen”. Während die erste Zeile unbrauchbar ist, gibt es bei der Zweiten nur einen kleinen Fehler. Fairerweise muss man sagen, das dieses Ergebnis vermutlich dem Kontrast geschuldet ist. Markiert man weitere Bereich, ist die Erkennung besser. Es kommt also immer auch auf die Vorlage darauf an. Bilder sollten mindest 300 DPI an Auflösung haben.
Verheiratet, Vater von zwei Kindern, eines an der Hand, eines im Herzen. Schon immer Technik-Freund, seit 2001 in der IT tätig und seit über 10 Jahren begeisterter Blogger. Mit meiner Firma IT-Service Weber kümmern wir uns um alle IT-Belange von gewerblichen Kunden und unterstützen zusätzlich sowohl Partner als auch Kollegen.
Hallo Andy, wir geht es mit Fraktur OCR? KADMON im Irfanview scheint diese Möglichkeit zu bieten, aber ich schaffe nicht es zu benutzen… Eine Idee? Was fehlt noch? (habe schon: Irfanview + Kadmon + Deutsches “spelling files”)
Vielen Dank.
Isidore