The Java Regex alebo Regulárny výraz je API pre definovať vzor na vyhľadávanie alebo manipuláciu s reťazcami .
Je široko používaný na definovanie obmedzenia reťazcov, ako je overenie hesla a e-mailu. Po preštudovaní Java regex tutoriálu budete môcť otestovať svoje regulárne výrazy pomocou Java Regex Tester Tool.
Java Regex API poskytuje 1 rozhranie a 3 triedy java.util.regex balík.
balík java.util.regex
Triedy Matcher a Pattern poskytujú možnosť regulárneho výrazu Java. Balík java.util.regex poskytuje nasledujúce triedy a rozhrania pre regulárne výrazy.
- Rozhranie MatchResult
- Trieda dohadzovačov
- Trieda vzorov
- Trieda PatternSyntaxException
Trieda dohadzovačov
Implementuje Výsledok zápasu rozhranie. Je to a motor regulárneho výrazu ktorý sa používa na vykonávanie operácií zhody v sekvencii znakov.
| Nie | Metóda | Popis |
|---|---|---|
| 1 | boolovské zhody() | otestujte, či sa regulárny výraz zhoduje so vzorom. |
| 2 | boolovské nájsť () | nájde ďalší výraz, ktorý zodpovedá vzoru. |
| 3 | boolean find (int start) | nájde ďalší výraz, ktorý sa zhoduje so vzorom z daného počiatočného čísla. |
| 4 | Skupina reťazcov () | vráti zhodnú podsekvenciu. |
| 5 | int start() | vráti počiatočný index zhodnej podsekvencie. |
| 6 | int end() | vráti koncový index zhodnej podsekvencie. |
| 7 | int groupCount() | vráti celkový počet zhodných podsekvencií. |
Trieda vzorov
To je kompilovaná verzia regulárneho výrazu . Používa sa na definovanie vzoru pre motor regulárneho výrazu.
| Nie | Metóda | Popis |
|---|---|---|
| 1 | statická kompilácia vzoru (regulárny výraz reťazca) | skompiluje daný regulárny výraz a vráti inštanciu vzoru. |
| 2 | Matcher matcher (vstup CharSequence) | vytvorí zhodovač, ktorý priradí daný vstup k vzoru. |
| 3 | statické boolovské zhody (regulárny výraz reťazca, vstup CharSequence) | Funguje ako kombinácia metód kompilácie a porovnávania. Skompiluje regulárny výraz a priradí daný vstup k vzoru. |
| 4 | Rozdelenie reťazca[] (vstup sekvencie znakov) | rozdelí daný vstupný reťazec okolo zhôd daného vzoru. |
| 5 | Vzor reťazca() | vráti vzor regulárneho výrazu. |
Príklad regulárnych výrazov Java
Existujú tri spôsoby, ako napísať príklad regulárneho výrazu v jazyku Java.
import java.util.regex.*; public class RegexExample1{ public static void main(String args[]){ //1st way Pattern p = Pattern.compile('.s');//. represents single character Matcher m = p.matcher('as'); boolean b = m.matches(); //2nd way boolean b2=Pattern.compile('.s').matcher('as').matches(); //3rd way boolean b3 = Pattern.matches('.s', 'as'); System.out.println(b+' '+b2+' '+b3); }} Vyskúšajte to Výkon
true true true
Regulárny výraz. Príklad
. (bodka) predstavuje jeden znak.
import java.util.regex.*; class RegexExample2{ public static void main(String args[]){ System.out.println(Pattern.matches('.s', 'as'));//true (2nd char is s) System.out.println(Pattern.matches('.s', 'mk'));//false (2nd char is not s) System.out.println(Pattern.matches('.s', 'mst'));//false (has more than 2 char) System.out.println(Pattern.matches('.s', 'amms'));//false (has more than 2 char) System.out.println(Pattern.matches('..s', 'mas'));//true (3rd char is s) }} Vyskúšajte to Regex triedy znakov
| Nie | Trieda postavy | Popis |
|---|---|---|
| 1 | [abc] | a, b alebo c (jednoduchá trieda) |
| 2 | [^abc] | Akýkoľvek znak okrem a, b alebo c (zápor) |
| 3 | [a-zA-Z] | a až z alebo A až Z vrátane (rozsah) |
| 4 | [a-d[m-p]] | a až d alebo m až p: [a-dm-p] (spojenie) |
| 5 | [a-z&&[def]] | d, e alebo f (priesečník) |
| 6 | [a-z&&[^bc]] | a až z, okrem b a c: [ad-z] (odčítanie) |
| 7 | [a-z&&[^m-p]] | a až z, a nie m až p: [a-lq-z] (odčítanie) |
Regulárny výraz Triedy znakov Príklad
import java.util.regex.*; class RegexExample3{ public static void main(String args[]){ System.out.println(Pattern.matches('[amn]', 'abcd'));//false (not a or m or n) System.out.println(Pattern.matches('[amn]', 'a'));//true (among a or m or n) System.out.println(Pattern.matches('[amn]', 'ammmna'));//false (m and a comes more than once) }} Vyskúšajte to Kvantifikátory regulárneho výrazu
Kvantifikátory špecifikujú počet výskytov znaku.
| Regex | Popis |
|---|---|
| X? | X sa vyskytuje raz alebo vôbec |
| X+ | X sa vyskytuje raz alebo viackrát |
| X* | X sa vyskytuje nula alebo viackrát |
| X{n} | X sa vyskytuje iba n-krát |
| X{n,} | X sa vyskytuje n alebo viackrát |
| X{y,z} | X sa vyskytuje aspoň y-krát, ale menej ako z-krát |
Príklady tried znakov a kvantifikátorov regulárneho výrazu
import java.util.regex.*; class RegexExample4{ public static void main(String args[]){ System.out.println('? quantifier ....'); System.out.println(Pattern.matches('[amn]?', 'a'));//true (a or m or n comes one time) System.out.println(Pattern.matches('[amn]?', 'aaa'));//false (a comes more than one time) System.out.println(Pattern.matches('[amn]?', 'aammmnn'));//false (a m and n comes more than one time) System.out.println(Pattern.matches('[amn]?', 'aazzta'));//false (a comes more than one time) System.out.println(Pattern.matches('[amn]?', 'am'));//false (a or m or n must come one time) System.out.println('+ quantifier ....'); System.out.println(Pattern.matches('[amn]+', 'a'));//true (a or m or n once or more times) System.out.println(Pattern.matches('[amn]+', 'aaa'));//true (a comes more than one time) System.out.println(Pattern.matches('[amn]+', 'aammmnn'));//true (a or m or n comes more than once) System.out.println(Pattern.matches('[amn]+', 'aazzta'));//false (z and t are not matching pattern) System.out.println('* quantifier ....'); System.out.println(Pattern.matches('[amn]*', 'ammmna'));//true (a or m or n may come zero or more times) }} Vyskúšajte to Metaznaky regulárneho výrazu
Metaznaky regulárneho výrazu fungujú ako krátke kódy.
| Regex | Popis |
|---|---|
| . | Akýkoľvek znak (môže alebo nemusí zodpovedať terminátoru) |
| d | Akékoľvek číslice okrem [0-9] |
| D | Akékoľvek iné ako číslice, skratka pre [^0-9] |
| s | Akýkoľvek znak medzery, skratka pre [ x0Bf ] |
| S | Akýkoľvek znak bez medzier, skratka pre [^s] |
| In | Ľubovoľný znak slova, skratka pre [a-zA-Z_0-9] |
| IN | Akýkoľvek neslovný znak, skratka pre [^w] |
| Hranica slova | |
| B | Hranica bez slova |
Príklad metaznakov regulárneho výrazu
import java.util.regex.*; class RegexExample5{ public static void main(String args[]){ System.out.println('metacharacters d....');\d means digit System.out.println(Pattern.matches('\d', 'abc'));//false (non-digit) System.out.println(Pattern.matches('\d', '1'));//true (digit and comes once) System.out.println(Pattern.matches('\d', '4443'));//false (digit but comes more than once) System.out.println(Pattern.matches('\d', '323abc'));//false (digit and char) System.out.println('metacharacters D....');\D means non-digit System.out.println(Pattern.matches('\D', 'abc'));//false (non-digit but comes more than once) System.out.println(Pattern.matches('\D', '1'));//false (digit) System.out.println(Pattern.matches('\D', '4443'));//false (digit) System.out.println(Pattern.matches('\D', '323abc'));//false (digit and char) System.out.println(Pattern.matches('\D', 'm'));//true (non-digit and comes once) System.out.println('metacharacters D with quantifier....'); System.out.println(Pattern.matches('\D*', 'mak'));//true (non-digit and may come 0 or more times) }} Vyskúšajte to Otázka na regulárny výraz 1
/*Create a regular expression that accepts alphanumeric characters only. Its length must be six characters long only.*/ import java.util.regex.*; class RegexExample6{ public static void main(String args[]){ System.out.println(Pattern.matches('[a-zA-Z0-9]{6}', 'arun32'));//true System.out.println(Pattern.matches('[a-zA-Z0-9]{6}', 'kkvarun32'));//false (more than 6 char) System.out.println(Pattern.matches('[a-zA-Z0-9]{6}', 'JA2Uk2'));//true System.out.println(Pattern.matches('[a-zA-Z0-9]{6}', 'arun$2'));//false ($ is not matched) }} Vyskúšajte to
Otázka na regulárny výraz 2
/*Create a regular expression that accepts 10 digit numeric characters starting with 7, 8 or 9 only.*/ import java.util.regex.*; class RegexExample7{ public static void main(String args[]){ System.out.println('by character classes and quantifiers ...'); System.out.println(Pattern.matches('[789]{1}[0-9]{9}', '9953038949'));//true System.out.println(Pattern.matches('[789][0-9]{9}', '9953038949'));//true System.out.println(Pattern.matches('[789][0-9]{9}', '99530389490'));//false (11 characters) System.out.println(Pattern.matches('[789][0-9]{9}', '6953038949'));//false (starts from 6) System.out.println(Pattern.matches('[789][0-9]{9}', '8853038949'));//true System.out.println('by metacharacters ...'); System.out.println(Pattern.matches('[789]{1}\d{9}', '8853038949'));//true System.out.println(Pattern.matches('[789]{1}\d{9}', '3853038949'));//false (starts from 3) }} Vyskúšajte to Príklad Java Regex Finder
import java.util.regex.Pattern; import java.util.Scanner; import java.util.regex.Matcher; public class RegexExample8{ public static void main(String[] args){ Scanner sc=new Scanner(System.in); while (true) { System.out.println('Enter regex pattern:'); Pattern pattern = Pattern.compile(sc.nextLine()); System.out.println('Enter text:'); Matcher matcher = pattern.matcher(sc.nextLine()); boolean found = false; while (matcher.find()) { System.out.println('I found the text '+matcher.group()+' starting at index '+ matcher.start()+' and ending at index '+matcher.end()); found = true; } if(!found){ System.out.println('No match found.'); } } } } Výkon:
Enter regex pattern: java Enter text: this is java, do you know java I found the text java starting at index 8 and ending at index 12 I found the text java starting at index 26 and ending at index 30