POSIX in PCRE

POSIX ist ein Regular-Expression-Dialkekt, der die wichtigsten Muster, nach denen in Pattern gesucht wird, zu Zeichenklassen zusammenfaßt, jedoch nicht über die Flexibilität der Perl-kompatiblen Regular Expression Engines herankommt (PCRE). Die Tabelle unten enthält POSIX-Zeichenklassen und ihre Entsprechung in PCRE.

POSIX-ZeichenklasseEntsprechung in PCREfindet
[:alpha:] [a-zA-Z] alle Klein- und Großbuchstaben a-z
[:lower:][a-z]Kleinbuchstaben a-z
[:upper:][A-Z]Großbuchstaben a-z
[:alnum:][a-zA-Z0-9] oder [a-zA-Z\d] (schneller)alphanumerische Zeichen, kombiniert [:alpha:] und [:digit:]
[:digit:][0-9] oder \d (schneller)Ziffern 0-9
[:xdigit:][0-9a-fA-F] oder [\da-fA-F] (schneller)Hexadezimalzeichen
[:blank:][ \t]Leerzeichen und Tabulatoren
[:space:]\sWhite space
[:punct:][.,![]\"#$%&'()*+/:;<=>?@\^_´{|}~[-]*]Satzzeichen
[:graph:][a-zA-Z0-9.,![]\"#$%&'()*+/:;<=>?@\^_´{|}~[-]*]Schriftzeichen
[:cntrl:]keineSteuerzeichen

In neuen PCRE-Dialekten können fast alle POSIX-Zeichenklassen direkt verwendet werden. Die POSIX-Zeichenklasse wird dazu in eckigen Klammern notiert:

[[:alpha:]]