POSIX in PCRE
POSIX ist ein Regular-Expression-Dialkekt, der die wichtigsten Muster, nach denen in Pattern gesucht wird, zu Zeichenklassen zusammenfaßt, jedoch nicht über die Flexibilität der Perl-kompatiblen Regular Expression Engines herankommt (PCRE). Die Tabelle unten enthält POSIX-Zeichenklassen und ihre Entsprechung in PCRE.
| POSIX-Zeichenklasse | Entsprechung in PCRE | findet |
|---|---|---|
| [:alpha:] | [a-zA-Z] | alle Klein- und Großbuchstaben a-z |
| [:lower:] | [a-z] | Kleinbuchstaben a-z |
| [:upper:] | [A-Z] | Großbuchstaben a-z |
| [:alnum:] | [a-zA-Z0-9] oder [a-zA-Z\d] (schneller) | alphanumerische Zeichen, kombiniert [:alpha:] und [:digit:] |
| [:digit:] | [0-9] oder \d (schneller) | Ziffern 0-9 |
| [:xdigit:] | [0-9a-fA-F] oder [\da-fA-F] (schneller) | Hexadezimalzeichen |
| [:blank:] | [ \t] | Leerzeichen und Tabulatoren |
| [:space:] | \s | White space |
| [:punct:] | [.,![]\"#$%&'()*+/:;<=>?@\^_´{|}~[-]*] | Satzzeichen |
| [:graph:] | [a-zA-Z0-9.,![]\"#$%&'()*+/:;<=>?@\^_´{|}~[-]*] | Schriftzeichen |
| [:cntrl:] | keine | Steuerzeichen |
In neuen PCRE-Dialekten können fast alle POSIX-Zeichenklassen direkt verwendet werden. Die POSIX-Zeichenklasse wird dazu in eckigen Klammern notiert:
[[:alpha:]]