Startseite > Archiv > Textscanner effizient selbst bauen

Textscanner effizient selbst bauen

dotnetpro 2/2004 Von Ralf Westphal erschienen in dotnetpro 2/2004 auf Seite 140
Code: A0402Symbol
Keine Bewertung

Erkennungsdienst Grundlage für die Textprozessierung bei Spam-Filterung, Eingabevalidierung oder Kompilierung ist das Erkennen von Symbolen nach lexikalischen Regeln. Um diese Symbolerkennung zu vereinfachen, liefert der Artikel Rezepte für die Umsetzung von wiederkehrenden Regelmustern.

Artikel Download

Als Abonnent können Sie den gesamten Artikel als PDF abrufen und die zugehörigen Quelltexte direkt downloaden.

Sie sind bereits Abonnent? Dann registrieren Sie Ihr Abonnement jetzt online und greifen Sie sofort auf das komplette Artikelarchiv zu.

Einzelheft-Bestellung

Sie interessieren sich für diesen Artikel und haben noch kein Abonnement? Dann bestellen Sie doch einfach diese Ausgabe der dotnetpro als Einzelheft.

Abo-Bestellung

Probeabo
Wenn Sie die dotnetpro kennenlernen wollen, ist das Probeabo genau richtig für Sie. Lesen Sie die aktuelle sowie die kommende Ausgabe zu einem besonders günstigen Preis.








Abo
Wenn Sie die neue Ausgabe der dotnetpro als Erster lesen wollen, dann liegen Sie mit einem Abo genau richtig – zwölf Mal pro Jahr druckfrisch in Ihrem Briefkasten und das noch bevor das Heft am Kiosk erhältlich ist.

Sie finden diesen Artikel interessant? Dann helfen Sie anderen ihn zu finden und kicken Sie ihn bei www.dotnet-kicks.de!

Tags

_currentSymbolText   _currentSymbolType   _keywords   _source   _whitespaceChars   1402   1422   1442   1998   19980210   2003   2004141   2004143   2004www   A0402Symbol   Abbrechen   Abbruch   aber   abgebro   ableiten   Abschnitt   abzubrechen   abzuschließen   Adres   Adresse   ähnlich   aktuelle   Alias   alle   allen   aller   Allerdings   allgemein   allgemeinen   alsFachautor   also   alternativ   Alternative   alternativen   AmAnfangwardasWort   Analyse   AndAlso   ander   andere   anderen   anderes   andernfalls   anders   Anfang   Anfangszei   Anfangszeichen   Anfangszeichenmenge   Anfangszeichenmengen   Anfangszeichenmengenanderer   angesehen   angezeigt   anliegende   anschlie   Anteile   Anweisung   Anweisungsfolge   ArbeitliegtaufderVermittlungundAn   Artikel   Attributwert   auch   Aufbau   aufbauend   aufbauende   aufeinander   aufge   aufgebrochen   aufgeführt   Aufruf   Aufrufe   Aufrufs   auftreten   aufwändigste   Ausdruck   ausge   ausgedrückt   auslösen   Ausnahme   Aussage   ausse   Außerdem   Auszug   automatisch   Autor   Basisklasse   bauen   Bedarf   Bedeutung   Bedin   Bedingung   beginnen   beginnt   behandeln   behandelt   Beide   beiden   beim   Beispiel   Beispiele   beispielsweiseeinegroßeZahlvon   beliebi   beliebig   Benennen   benötigt   Berater   Bereich   Beschrei   beschrieben   besondere   besser   Bestandteile   beste   besteht   besten   bestimmen   Bezeichner   Bezeichnern   Bezeichnernamen   Bezeichners   Bezeichnersymbol   bezeichnet   bezie   beziehungsweise   blen   Blick   Block   Boolean   bricht   Buchsta   Buchstabe   Buchstaben   Bytes   ByVal   cetera   char   Check   CheckChar   chen   chenmengen   cher   ches   class   Coach   Code   Codes   codieren   Codierung   Codierungsmus   Contains   Current   currentChar   currentSymbolText   currentSymbolType   dafür   dagegen   daher   damit   dann   daran   darauf   darf   darstellen   Darüber   DarüberhinausistRalf   dass   Datei   dazu   Definieren   Definition   denen   denn   deren   derenSchlüsselder   derListederXML   dern   dernfalls   DerSchwerpunktseiner   deshalb   dessen   desto   diese   diesem   diesen   dieser   dings   dingung   direkt   direkten   disjunkt   disjunkter   Domain   Dort   dotnetpro   dotnetpro11   drei   dritten   drückt   durch   durchführen   dürfen   eben   Ebenso   EBNF   eigene   eindeutig   eine   eineHashtable   einem   einen   einer   eines   einfach   einfache   einfacher   Einfachheit   Einfügen   Einführung   Eingabe   Eingabestrom   EingabevalidierungoderKompilierung   Eingabezeichenstroms   einige   einmal   EinmalOderMehrmals   EinScannerfürganzeZahlen   Einschrän   einsetzt   EinZeichen   einzeln   einzelne   einzelnen   einzelner   einzige   else   Elseif   Emailadresse   Ende   entfallen   enthält   enthalten   entschärft   entscheiden   entscheidet   Entscheidung   entspricht   entweder   Entwickler   Enum   Epsilon   erarbei   erarbeitet   erfolgt   ergibt   erhält   erkannt   Erkannte   erken   erkennen   erkennenden   erkennt   Erkennung   Erkennungsdienst   ErkennungsroutinenfüreineinzelnesZeichen   ermitteln   ermittelt   Ermittlung   erreicht   erst   erste   ersten   Erstes   Erwähnung   erwartet   erwarteten   Erwartung   esirgendwie   etwa   etwas   Exit   fach   fachen   Fall   Fälle   falls   falsches   false   fassen   fasst   Fast   fehl   Fehler   Fehlt   Filterung   finden   Folge   folgen   folgende   Folgenden   folgt   forKeyword   Form   formale   formaler   Formulierung   Framework   fügt   führt   Function   Funktion   gabe   gabestrom   ganz   ganze   geführt   gefunden   Gegen   gehört   geht   gekennzeichnet   gelesen   gelesene   geliefert   gelwerken   gelwerks   genannten   genau   genauso   genügen   geprüft   gerade   gerlich   gesammelt   gestoßen   getrennt   gewünschte   gezeigt   gibt   gienund   gilt   gleich   Gleiches   Glück   GroberAufbaudesXML   Großbuchstabe   Grund   Gründen   Grundhandwerkszeug   GrundlagefürdieTextprozessierungbeiSpam   Grundlagen   grundlegenden   Gruppen   gung   haben   halten   handeln   Handvoll   Hashtable   häufiger   Heft   heißt   hier   Hieraus   higen   Hilfskonstrukt   Hilfsroutinen   Hilfsvariable   hinaus   hineingelesen   Hinter   hinzu   hörige   hungsweise   Idealbe   idealerweise   Identifier   IdentScanner   ignorieren   Ihnen   Ihre   Ihrer   immer   imple   implementiert   Implementierung   Inherits   innerhalb   Instanzvariablen   IntegerScanner   IsDigit   istdasErkennenvonSymbolennachlexikalischenRegeln   jedem   jedes   jedoch   jetzt   jeweils   junkt   kalischen   kann   Kasten   kein   keine   keinen   kennen   Kennung   kleinen   Knoten   Kommt   komplexe   komplexerer   können   könnte   Konstruktor   konzepteaufBasisdes   korrekte   kung   kürzer   kürzt   lang   Länge   länger   lässt   lauffä   läuft   lauten   lautet   leer   leeres   Leerzei   Leerzeichen   legendenallgemeinenundeinfachen   leicht   leider   lein   Lesen   letzte   letzten   Level   lexi   lexika   lexikali   Lexikalische   lexikalischen   LexikalischeRegelnaufstellen   lexikalisches   liefert   liefertderArtikelRezeptefürdieUmsetzungvonwiederkehrendenRegelmustern   liegende   liegt   Liest   lischen   Liste   Listing   Literal   Literale   Literalen   Literals   Literatur   logischer   lohnt   Loop   Lösung   lungsoperator   macht   Mail   maxC   mehr   mehrere   meisten   Menge   mens   mensende   menssymbole   mentiert   mentierungvonRegelnnutzen   Metazeichen   Metazeichenimplementieren   Methode   minC   möchte   Möglichkeit   möglichst   MSDNRegionalDirectors   mühsam   muss   müssen   Muster   Mustern   MyBase   myCounter   nach   nachdem   nacheinan   nacheinander   nächste   nächsten   Name   NameA   NameANameB   NameB   NameChar   Namenssymbol   Namenssymbole   nannten   natürlich   negativen   nehmen   Next   nextKeyword   nicht   Nichtübereinstimmung   nichtvorhandenes   noch   notie   nötig   nung   oben   obigen   oder   Ohne   ohnehin   Operation   Operator   Operatoren   Option   optional   optionalen   OptionalesZeichen   OPTIONS   OrElse   Overrides   Parameter   Parser   passiert   Prinzip   private   Problem   Programmier   ProjektXmlParser   Property   prozessierenden   prüfen   prüft   Prüfung   prüfungen   public   Quasi   quenzielle   Rahmen   RalfWestphal   RalfWestphalistfreier   rators   Read   ReadChar   ReadOnly   reagieren   Regel   Regelmengen   Regeln   Regelscanner   Regelwerk   Regelwerke   Regelwerkeimplementieren   ReguläreAusdrückefürdieImple   reiche   Reihe   Reihenfolge   relevant   rent   repräsentiert   reservierten   return   Richten   richtige   Rückgabewert   runde   rung   sähen   sammenhang   sammenlegen   sammensetzen   Scanner   ScannerBase   ScannerException   Scannern   Scannerprogrammie   Scanners   ScannerzumErkennenvonBezeichnernundSchlüsselwörternmittelsSchlüsselworttabelle   Schaut   sche   scheidungsgrundlage   Schema   schen   schere   schieden   schiedene   schiedlich   schlägt   Schleife   Schleifen   Schlüsselwörter   Schlüsselwörtern   Schlüsselwortsymbol   Schlüsselworttext   schneidung   Schnitt   schon   schreibt   schrieben   Schritt   Schritten   Second   SecondLevelDomain   sehen   Sehr   sein   seiner   Seite92ff   selbst   Serie   sich   sicher   sicherlich   siehe   sieht   simpelste   simples   sind   SkipWhitespace   Sobald   sofort   Software   solche   soll   sollen   Sollte   sollten   sondern   Sonst   source   sozusagen   Spalten   Spalteninhalte   spezifi   spezifizieren   Sprache   SprachenVisualBasic   spricht   ßend   ständig   Statt   stehen   steht   stellen   stellt   string   Strom   Symbo   symbol   Symboldefinition   Symboldefinitionen   Symbole   Symbolen   Symbols   Symboltabelle   Symboltext   Symboltextes   Symboltextverzeichnisse   Symboltyp   Symboltypen   SymbolTypes   Syntaktisch   syntaktischen   Syntaxprüfer   systemati   systematisch   Tabulator   TagEnd   TagEndEmpty   TAGOPENSTART   TagStartClose   TagStartOpen   taucht   TechnikSymbolerkennung   technolo   Technologie   tenundallerweiterenZeichenzu   tern   Text   Textart   Texte   Texten   Textinhalt   Textprozessor   Textscannereffizientselbstbauen   Textsteuerelement   THEN   thode   Throw   throwError   tionaler   toKeyword   TopLevelDomain   transpa   trennen   Trenner   trennt   tributWert   Tritt   trotzdem   true   tung   typisch   typisches   über   überführen   überliest   Übersetzung   Üblicherweise   UmdieseSymbolerkennungzuverein   umfangrei   umfangreicherer   Umset   umsetzen   Umsetzung   UmsetzungderlexikalischenRegelfürNamen   undAusland   undistSprecheraufKonferenzenimIn   unerwartet   Ungültiges   UnreadChar   unten   unter   unterscheiden   unwei   Validierung   Varia   variabel   Variablenname   vbprj   Verarbeitung   VereinfachenderAuszugaus   Verfahren   Vergleich   vergleicht   Verhalten   Verket   Verkettung   verknüpft   Verknüpfung   verlassen   verläuft   Vermittler   vernachlässigen   verschieden   verständlich   versucht   verwenden   verzeichnisse   verzichtet   viele   vielen   vielleicht   VielzahlverschiedenerSymbole   voll   vonein   voneinander   voran   vorangegangenen   VoraussetzungenVS   vorgehen   vorgestellten   vorkommen   vorlie   vorliegt   Vorzeichen   vorzeichenbehaftete   wählen   wäre   Wartung   Wege   wegen   weil   weisungen   weite   weiter   weitere   weitListing   welchen   welcher   wendungmodernerSoftware   Wenn   werden   Werk   werkes   Wert   WestphaleinerderdeutschenMicrosoft   while   Whitespace   wichtig   wieder   wiederho   wiederholende   Wiederholung   Wiederholungsoperator   will   wird   wofür   worden   Worte   wörtern   wurde   würde   würden   Zahl   Zahlen   Zeichen   Zeichenbe   Zeichenbereichs   ZeichendemaktuellenSymboltext   Zeichenfolge   Zeichenfolgen   Zeichenketten   zeichenmengeebenfallskeineÜber   Zeichens   zeigt   Zeilentrenner   Zeilenwechsel   zelne   ziehungsweise   Ziffer   ZifferMitVorzeichen   Ziffern   Ziffernprüfung   Ziffernzeichen   zuge   Zugeständnis   zugewiesen   zulässt   zuletzt   zumindest   zunächst   zung   Zuordnung   zurück   zusammen   Zusätzlich   Zuweisung   Zweck   zwei   zweite   zweiten   zwischen

Login
Sie sind nicht eingeloggt.

Login & Registrierung
Abo bestellen





Anzeige





Newsletter
Tragen Sie Ihre E-Mailadresse für den kostenlosen Newsletter von dotnetpro ein.


Umfrage
Wie zufrieden sind Sie mit Ihrem Gehalt?




Ergebnis anzeigen