Nanonets, Vihar Kurama 22.01.2020, 12:10 Uhr

Tabellen-Daten aus Scans extrahieren und einlesen

Die Aufgabe: In 2000 Seiten eingescannter Dokumente die Tabellen erkennen und die darin enthaltenen Informationen einlesen, beispielsweise in ein Tabellenkalkulationsprogramm.

(Quelle: nanonets.com)

Wie man diese Aufgabe angehen und mit Hilfe von Deep-Learning-Algorithmen lösen kann, erklärt Vihar Kurama in seinem englischsprachigen Artikel auf Nanonets.com. Sein Artikel befasst sich ausführlich mit dem Extrahieren von Informationen aus Tabellen. Der Autor erklärt wie man mit modernen Technologien wie Deep Learning und Computer Vision (maschinelles Sehen) alltägliche Aufgaben automatisieren kann, indem man robuste Algorithmen für die Ausgabe genauer Ergebnisse entwickelt.

Zu Beginn zeigt Kurama auf, in welchen Branchen und Geschäftsbereichen das Einlesen von Daten aus gedruckten und eingescannten Dokumenten erforderlich ist, beispielsweise wenn es um Formulare oder Rechnungen geht, die digitalisiert werden sollen. Kurama skizziert einen Algorithmus mit Hilfe von Computer, um die Position von Informationen in den Tabellen mit Hilfe von Schwellenwert-, Dilatations- und Konturerkennungstechniken zu finden. Er erörtert die Herausforderungen, denen man bei der Tabellenerkennung, -extraktion und -konvertierung bei der Verwendung herkömmlicher Techniken begegnen kann und erklärt, wie Deep Learning bei der Bewältigung dieser Probleme behilflich sein kann. Schließlich beschreibt er einige neuronale Netzwerkarchitekturen und deren Möglichkeiten zur Tabellenextraktion auf der Grundlage der gegebenen Trainingsdaten. Den lesenswerten Beitrag von Vihar Kurama finden Sie auf dieser Seite..

Autor(in) Bernhard Lauer