OCR-Komponenten für .NET 14.10.2019, 00:00 Uhr

Rechner lernt lesen

Mit diesen Tools wandeln Sie in Bilddateien enthaltenen Text in bearbeitbaren um.

Mitunter sollen Teile ausgedruckter Dokumente als Text weiterverarbeitet werden, ob als Zitate oder als Grundlage eigener Dokumente. Auch die Auffindbarkeit in Datenbanken mit Volltextsuche, zur Archivierung oder zur Umwandlung in Blindenschrift sind Gründe, Text in Bildern in Text umzuwandeln. Wer diese Texte dann nicht abtippen will, muss auf Optical Character Recognition (OCR) zurückgreifen. Einige Tools zum Scannen von Dokumenten wurden bereits in [1] vorgestellt. Spezielle Lösungen und SDKs für die Texterkennung erlauben Ihnen, die eingescannten Dokumente im Bildformat zu analysieren und den darin gefundenen Text zu extrahieren. Im Rahmen der OCR-Funktionen werden nicht nur Gliederungselemente, sondern auch der Text und dessen Absatz- und Zeichenformatierungen erkannt.

www.dotnetpro.de/SL1911HighFive1

Jetzt 1 Monat kostenlos testen!

Sie wollen zukünftig auch von den Vorteilen eines plus-Abos profitieren? Werden Sie jetzt dotnetpro-plus-Kunde.

+ Digitales Kundenkonto,
+ Zugriff auf das digitale Heft,
+ Zugang zum digitalen Heftarchiv,
+ Auf Wunsch: Weekly Newsletter,
+ Sämtliche Codebeispiele im digitalen Heftarchiv verfügbar