Hintergrund: Texterkennung in Fotos

texterkennung1

unter der Lupe

Heute mal ein kurzer Blick hinter die Kulissen: Wie funktioniert die Texterkennung bei Evernote? Oft sind Anwender, die neu mit Evernote beginnen, erstaunt, dass Texte in Fotos oder von handschriftlichen Notizen wirklich gut gefunden werden. Heutige Software erledigt das zwar generell ganz gut bei „klaren“ Vorlagen, etwa einem gut ausgeleuchteten Schriftstück aus dem Drucker. Es kommen dabei u. a. verschiedene Näherungsverfahren zum Einsatz, z. B. Häufigkeitsstatistiken, Kontext (was steht vor und nach dem zu erkennenden Wort) usw. Abschließend trifft die Software die Entscheidung für die wahrscheinlichste Variante und setzt diese in den erzeugten Text ein. Und entweder stimmt das Wort dann – oder eben nicht.

Für Evernote steht aber nicht die Erzeugung eines flüssig lesbaren Textes im Vordergrund, die Software möchte vielmehr sicher gehen, dass bei einer Suche auch wirklich die Notiz gefunden wird. Daher weist sie nicht eindeutig zu erkennenden Begriffen mehrere Bedeutungen zu. Als Beispiel mag der oben abgebildete Text dienen. Für das menschliche Gehirn natürlich problemlos zu entziffern, die „Maschine“ hingegen kämpft mit der Biegung der Buchseite, mit einer ungleichmäßigen Beleuchtung, mit einem groben Papier usw. Evernote fügt daher zu der wahrscheinlichsten „Übersetzung“ noch Alternativen hinzu. „Wir stellen …“: hier erkennt Evernote zwar „stellen“, nimmt aber ebenfalls die Begriffe „steilen“ und „steTen“ in seinen Suchindex auf. „In jeden Topf“ wird ergänzt mit „Top!“ und „Top“; „geben wir“ mit „gehen“ usw.

texterkennung2

der Code dahinter

Das ist der Grund, weshalb man bei den meisten Evernote-Notizen nicht einfach den erkannten Text exportieren kann, man würde einen sehr holprigen Text erhalten.

texterkennung3

Text speichern

Im Unterschied zu Fotos kann man bei PDF-Dokumenten, die gut für Evernote zu erkennen waren, hingegen Glück haben. Sofern man über einen Premium-Account verfügt, erscheint bei diesen Dateien (meist mit zeitlicher Verzögerung) ein zusätzlicher Menüpunkt: „Durchsuchbares PDF-Dokument speichern“. Die gespeicherte Datei enthält dann den „puren“ Text, den man via Zwischenablage in andere Programme übernehmen kann.

Das könnte Dich auch interessieren...

1 Antwort

  1. 30. März 2014

    […] Evernote für Pfiffige: Heute mal ein kurzer Blick hinter die Kulissen: Wie funktioiert die Texterkennung bei Evernote? Oft sind Anwender, die neu mit Evernote beginnen, erstaunt, dass Texte in Fotos oder von handschriftlichen Notizen wirklich gut gefunden werden. – http://notieren.de/hintergrund-texterkennung-in-fotos/ […]