POSIX in PCRE
POSIX ist ein Regular-Expression-Dialkekt, der die wichtigsten Muster, nach denen in Pattern gesucht wird, zu Zeichenklassen zusammenfaßt, jedoch nicht über die Flexibilität der Perl-kompatiblen Regular Expression Engines herankommt (PCRE). Die Tabelle unten enthält POSIX-Zeichenklassen und ihre Entsprechung in PCRE.
POSIX-Zeichenklasse | Entsprechung in PCRE | findet |
---|---|---|
[:alpha:] | [a-zA-Z] | alle Klein- und Großbuchstaben a-z |
[:lower:] | [a-z] | Kleinbuchstaben a-z |
[:upper:] | [A-Z] | Großbuchstaben a-z |
[:alnum:] | [a-zA-Z0-9] oder [a-zA-Z\d] (schneller) | alphanumerische Zeichen, kombiniert [:alpha:] und [:digit:] |
[:digit:] | [0-9] oder \d (schneller) | Ziffern 0-9 |
[:xdigit:] | [0-9a-fA-F] oder [\da-fA-F] (schneller) | Hexadezimalzeichen |
[:blank:] | [ \t] | Leerzeichen und Tabulatoren |
[:space:] | \s | White space |
[:punct:] | [.,![]\"#$%&'()*+/:;<=>?@\^_´{|}~[-]*] | Satzzeichen |
[:graph:] | [a-zA-Z0-9.,![]\"#$%&'()*+/:;<=>?@\^_´{|}~[-]*] | Schriftzeichen |
[:cntrl:] | keine | Steuerzeichen |
In neuen PCRE-Dialekten können fast alle POSIX-Zeichenklassen direkt verwendet werden. Die POSIX-Zeichenklasse wird dazu in eckigen Klammern notiert:
[[:alpha:]]