Tesseract Intelligente Alternative zu Tesseract bringt Unternehmen im OCR-Bereich voran

Was ist Tesseract – und wo liegen die Grenzen?

Tesseract ist eine frei verfügbare Software für die optische Zeichenerkennung (Optical Character Recognition, kurz OCR). OCR hat eine wichtige Aufgabe in Unternehmen: Die Technologie wandelt die Inhalte verschiedener Dokumente, etwa gescannter Papierdokumente, in maschinenlesbare, bearbeitbare und durchsuchbare Dateien um. In diese werden der Text und die in den Dokumenten befindlichen Informationen extrahiert. Dies wiederum ist die Grundlage für papierlose, digitale Prozesse.

Die Software Tesseract ist bei Unternehmen weltweit zur Zeichen- und Texterkennung im Einsatz. Allerdings hat die Technologie ihre Grenzen. Gerade bei Fotos oder Dokumenten-Scans mit geringer Auflösung entstehen immer wieder Schwierigkeiten beim Erkennen der Zeichen und Texte. Beispielsweise wird das "ß" als "B" erkannt und der Text so falsch extrahiert. Die mäßige Qualität der Zeichenerkennung ist jedoch nicht das einzige Problem der Software. So soll der Text nach der Erkennung oftmals mit Tesseract weiterverarbeitet werden. Häufig kommt hierfür die beliebte Programmiersprache Python zum Einsatz. Die entsprechende Anbindung der OCR-Lösung gestaltet sich jedoch als sehr komplex.

Weiterhin beinhaltet die OCR von Tesseract keine Möglichkeiten, Daten aus dem Text strukturiert zu extrahieren. Somit ist es der Software nicht möglich, gängige Prozesse end-to-end zu automatisieren. Nur zwei Beispiele für derartige Workflows sind die Rechnungsprüfung auf Basis einer PDF-Rechnung oder auch die Aufnahme von Fahrzeugdaten aus einem Foto eines Fahrzeugscheins.

Aufgrund dieser und einiger weiterer Schwächen suchen viele Unternehmen für ihre optische Zeichenerkennung (OCR) nach einer Alternative zu Tesseract . In diesem Fall lohnt sich ein Blick auf das in Deutschland entwickelte Produkt Konfuzio.

Konfuzio: Tesseract-Alternative punktet mit intelligenter OCR

Konfuzio ist eine KI-basierte, selbstlernende Software, die sich seit dem Jahr 2018 auf dem Markt befindet. Entwickelt wurde sie von der Helm & Nagel GmbH mit Sitz in Aßlar. Die leistungsstarke Lösung zur Zeichen- und Texterkennung extrahiert Informationen aus beliebigen Dokumenten äußerst präzise und schnell in strukturierte Informationen. Hierbei nutzt sie einen definierten Prozess, der wie folgt skizziert werden kann:

1) Segmentierung von Seiten: KI erkennt Elemente wie Tabellen, Überschriften und Absätze (sprachenunabhängig)

2) Text wird mittels OCR erkannt: Auswahl der am besten geeigneten OCR-Technologie erfolgt automatisch anhand der Dokumentenqualität

3) Automatisches Lesen der Inhalte: Natural Language Processing Tool erkennt Entitäten wie Unternehmen, Personen, Orte und Zeitangaben

4) Transferlernen: KI erkennt Informationen im Kontext; beispielsweise wird die Rechnungsnummer der Rechnung oder die Artikelnummer einer Rechnungsposition zugeordnet

5) Anreicherung und Anwendung von Regeln: Dokumentendaten können via API oder CSV um weitere Daten angereichert werden; weiterhin lassen sich fachliche Regeln anwenden (zum Beispiel Prüfung der Gültigkeit einer Umsatzsteueridentifikationsnummer)

6) Übergabe an das Zielsystem (zum Beispiel ERP oder CRM)

Die KI von Konfuzio ist sofort einsatzbereit und entwickelt sich kontinuierlich weiter. Hierzu benötigen Unternehmen keine IT-Experten. Vielmehr genügt eine Schulung des Fachbereichs, um die Künstliche Intelligenz im Live-Betrieb immer weiter zu verbessern.

Geeignet für zahlreiche Anwendungsfälle

Anders als Tesseract eignet sich die Software von Konfuzio für weitaus mehr Geschäftsprozesse und Dokumentenarten. Beliebt ist die Lösung beispielsweise im Zusammenhang mit der Automatisierung der Eingangsrechnungsverarbeitung. Denn das zugrundeliegende KI-Modell kann über 100 Felder pro Rechnung erkennen und so alle Arten von Daten extrahieren. Damit ist es unter anderem möglich, Informationen über den Kreditor, die einzelnen Posten, den Ansprechpartner oder die Bankverbindung an das vorhandene ERP- oder CRM-System zu übertragen.

Eingesetzt wird Konfuzio auch für Zahlungsavise, um die Buchung des Accountings zu automatisieren. Bei Versicherungen wird die Lösung genutzt, um Daten für den Abschluss von Kfz-Versicherung auszulesen – etwa die Herstellerschlüsselnummer (HSN) und Typschlüsselnummer (TSN) aus der Zulassungsbescheinigung. Doch auch für die Extraktion von Bilanzinformationen wird das Tool verwendet.

Die Liste der möglichen Anwendungsfälle ist noch weitaus länger. Klar wird jedoch bereits jetzt: Konfuzio kann mit seiner professionellen und intelligenten Texterkennung bei Unternehmen aller Branchen zur Prozessverbesserung und -automatisierung beitragen. Verfügbar ist die Lösung in mehreren Betriebsmodellen: als SaaS in einer Public Cloud oder Private Cloud sowie "on premise".
Impressum
Helm & Nagel GmbH
Rosenweg 5
35614 Werdorf | Stadt Aßlar
Deutschland
T: 0049-6441-8994005
@: infokonfuzio.com
Ein Angebot von advertorial.de