Reguläre Ausdrücke in Java

Einführung

Reguläre Ausdrücke sind ein Satz oder eine Folge von Sonderzeichen, die im Allgemeinen verwendet werden, um andere Zeichenfolgen oder eine Sammlung von Zeichenfolgen zuzuordnen oder mit diesen abzugleichen. Diese Ausdrücke haben ihre eigene Syntax, die sich vom herkömmlichen Programmierstil unterscheidet. Um das Konzept der regulären Ausdrücke zu verwenden, muss das folgende Paket in Ihren Code importiert werden:

java.util.regex.* importieren;

Erfassen von Gruppen

Das Erfassen von Gruppen ist die Technik, mehr als einen Satz von Zeichen als eine einzige Einheit darzustellen. Gruppen werden häufig in Programmen für reguläre Ausdrücke verwendet. Eine Gruppe wird durch Klammern oder Klammern bestimmt. Zum Beispiel (cat) steht für eine einzelne Gruppe oder Einheit, die die Zeichen 'c', 'a' und 't' enthält. Mehrere Gruppen können zusammengeknüppelt werden. Die Anzahl der Gruppen wird durch Zählen der sich öffnenden Klammern von links nach rechts bestimmt. Nehmen wir das Beispiel von ((A)(B(C))). Dieser Ausdruck hat die folgenden vier Gruppen:

  • ((ABC)))
  • (A)
  • (B(C))
  • (C)

Syntax für reguläre Ausdrücke

UnterausdruckStreichhölzer
^Entspricht dem Zeilenanfang
$Entspricht dem Zeilenende
[...]Einzelnes Zeichen in Klammern
[^..]Einzelnes Zeichen nicht in Klammern
\AAnfang der Saite
\ZEnde der Zeichenfolge
a|bEntspricht entweder a oder b
\wWortzeichen
\WNicht-Wort-Zeichen
\sLeerzeichen
\dDigits
\DNichtziffern
\GSpiele, bei denen das letzte Spiel gemacht wurde

 

Einige der am häufigsten verwendeten Methoden der Matcher-Klasse

  • public int start () – Der Aufruf dieser Methode gibt eine ganze Zahl zurück, die die Startindexnummer der letzten übereinstimmenden Zeichenfolge ist.
  • public int start (int group) – Diese Methode gibt die Startindexnummer der Untersequenz zurück, die von der angegebenen Gruppe während der letzten Match-Sequenz aufgezeichnet wurde.
  • public int end() – Diese Methode gibt den Integer-Offset zurück, nachdem das Programm die letzte Zeichenübereinstimmung gefunden hat.
  • public int end (int group) – Gibt den Integer-Offset der angegebenen Gruppe zurück, nachdem das Programm die letzte Zeichenübereinstimmung gefunden hat.

Hinterlassen Sie eine Nachricht

Diese Seite verwendet Akismet, um Spam zu reduzieren. Erfahren Sie, wie Ihre Kommentardaten verarbeitet werden.