Bedienung > Hauptmenü > Menü: Einstellungen > Projekteinstellungen > Parser/Scanner

Wortgrenzen

Top Previous Next

Bedienung > Hauptmenü > Menü: Einstellungen > Projekteinstellungen > Parser/Scanner > Wortgrenzen

Diese Option wirkt sich auf die Erkennung literaler Token aus, nicht jedoch auf reguläre Ausdrücke.

Bei aktivierter Wortgrenzen-Option gilt ein Token nur dann als erkannt, wenn es mit einer Wortgrenze beginnt und endet. An einer Wortgrenze in TETRA ist zumeist ein Zeichen beteiligt, das nicht alphanumerische ist und kein Unterstrich ist, also nicht zur Zeichenklasse \w gehört. Genau ist die Grenze durch drei Fälle definiert

das an das Token angrenzende Zeichen gehört nicht zu \w oder

das außenstehende Zeichen des Tokens gehört nicht zu \w oder

das Token bildet den Beginn bzw. das Ende des Eingabetextes

Beispiel:

in dem Text:

"sindbad der seefahrer"

hätten folgende Ausdrücke jeweils zei Wortgrenzen: "sindbad", "der" und "seefahrer".

Jeweils nur ein Wortgrenze hätten z.B.: "sind", "bad", see" und "fahrer".

An dem Beispiel erkennt man, dass es bei deaktivierten Wortgrenzen möglich ist, auch die interne Struktur einzelner literaler Worte zu analysieren.

Im Normalfall wird empfohlen die Option zu aktivieren, da es sonst zu falschen Erkennungen kommen kann. Ist bei deaktivierter Wortgrenze beispielsweise ein Token "end" definiert, so erkennt es fälschlich bereits den Anfang des Variablennamens in der folgenden Zeile

endVar := 10;

end

Diese Seite gehört zur TextTransformer Dokumentation

Home Inhalt English