Vor allem in der Finanzbranche sind papierbasierte Prozesse immer noch die Norm. Um die Verarbeitung von Rechnungen, Quittungen oder Schecks zu automatisieren, sind qualitativ hochwertige digitale Kopien dieser Dokumente erforderlich, die die App-User:innen in Echtzeit an das Backend übermitteln können. Durch jahrelange Zusammenarbeit mit Finanzanbietern haben wir Einblicke darin gewonnen, wie Unternehmen Scanbots Document Scanner und OCR SDK bestmöglich einsetzen können. Lassen Sie uns in die wesentlichen Best Practices eintauchen, die Ihre Arbeitsabläufe auf einen neuen Standard heben werden.
Empfehlungen für eine reibungslose Scan-Erfahrung
Die Integration eines Document Scanner SDKs in eine mobile App verfolgt ein übergeordnetes Ziel: eine hohe automatisierte Verarbeitungsrate. Um einen einwandfreien Back-End-Betrieb und gleichzeitig eine reibungslose Benutzererfahrung zu ermöglichen, sollten Finanzunternehmen die folgenden Empfehlungen berücksichtigen, die wir aus der engen Zusammenarbeit mit Branchenexperten gewinnen konnten.
Automatisches vs. manuelles Auslösen der Kamera
Für ein besseres Nutzererlebnis kann Ihre App automatische Aufnahmen durchführen, sobald die Bedingungen dafür ausreichend gut sind. Wenn Sie diese Funktion aktivieren, können Sie deren Empfindlichkeit zwischen 0 und 1 einstellen. Wir empfehlen einen Wert zwischen 0,66 und 0,8.
Unschärfeerkennung
Diese Funktion erkennt, wie verschwommen die Aufnahme der Kund:innen ist. Überschreitet dieser Wert eine bestimmte Schwelle, so sollte die Aufnahme wiederholt werden. Diesen Schwellenwert können Sie an die Anforderungen Ihres Backends anpassen. Wir empfehlen einen Wert von 0,5.
Bildfilter
Sofern Ihre Backend-Lösung eine bereits binarisierte Bilddatei benötigt, können Sie einen entsprechenden Filter zuschalten. Alternativ wendet das SDK einen Grayscale-Filter an.
Bitte beachten Sie, dass der von Ihnen gewählte Filter unbedingt für Ihre Backend-Lösung geeignet sein muss! Einige Backend-Systeme wenden automatisch ihre eigenen Filter an.
Cropping-Screen
Bei guten Scanbedingungen wird das Dokument automatisch erfasst, nachjustiert und zugeschnitten. Bei ungünstigen Bedingungen müssen die Nutzenden diese Schritte jedoch manuell durchführen. Durch die Implementierung eines Cropping-Bildschirms können Ihre Kund:innen die Qualität des Bildes durch Rotation und Zuschnitt selbst optimieren. Damit sinkt der Aufwand für die manuelle Prüfung Ihrerseits.
Backend-Konfiguration
Um nach dem perfekten Scan auch zum perfekten Ergebnis zu kommen, müssen Front- und Backend aufeinander abgestimmt sein. Das Scanbot SDK muss daher so konfiguriert werden, dass die erstellten Dokumente optimal vom Backend verarbeitet werden können. Dies betrifft insbesondere die Format- und Filteroptionen.
Da es viele Backend-Lösungen auf dem Markt gibt, bieten wir keine Einheitslösung an. Hier sind jedoch einige wichtige Punkte, auf die Sie achten sollten:
- Welches Dateiformat benötigt Ihr Backend? (TIFF, PDF, JPG?)
- Wendet Ihr Backend einen Filter auf die empfangene Bilddatei an? Oder muss dies vor der Backend-Verarbeitung passieren? (Filter sollten möglichst nicht zweimal angewendet werden.)
- Legt Ihr Backend eine minimale oder maximale Auflösung für zu verarbeitende Bilddateien fest? (Diese müssen gegebenenfalls skaliert werden.)
Lassen Sie uns anhand eines Anwendungsbeispiels des deutschen Start-up-Unternehmens Taxfix zur praktischen Umsetzung kommen
OCR-Scanning mit dem Scanbot SDK
Der perfekte Scan ist zwar die Schlüsselkomponente für makellose OCR-Ergebnisse, aber diese zusätzlichen Best Practices werden Ihnen helfen, die Leistung noch weiter zu verbessern.
Sprachen
Sie können mehrere Sprachen für die OCR verwenden. Da die Erkennung von Zeichen und Wörtern jedoch ein sehr komplizierter Prozess ist, sinkt die Gesamtgenauigkeit, wenn die Anzahl der Sprachen erhöht wird. Je mehr Sprachen verwendet werden, desto mehr Wörter können den erkannten Zeichen zugeordnet werden. Wir empfehlen daher, so wenige Sprachen wie möglich zu verwenden. Stellen Sie sicher, dass die Sprache, die Sie zu erkennen versuchen, vom SDK unterstützt wird.
Schriftarten
Die mit OCR trainierten Daten sind für gängige Serifen- und serifenlose Schriftarten optimiert. Zier- oder Schreibschriften vermindern die Erkennungsgenauigkeit drastisch. Es wird empfohlen, sicherzustellen, dass die verwendeten Dokumente diesen gängigen Schriftarten entsprechen.
Möchten Sie Ihren Arbeitsablauf um das mobile Scannen von Dokumenten erweitern? Nehmen Sie jetzt Kontakt zu unseren Expert:innen auf. Wir freuen uns darauf, Ihre individuellen Anforderungen zu besprechen.