Java nyelven, hasító húr fontos és általában használt művelet a kódolás során. A Java többféle módot kínál erre kettévágja a húrt . De a leggyakoribb módja a split() metódus a String osztályból. Ebben a részben megtanuljuk hogyan lehet felosztani egy karakterláncot Java nyelven határolóval. Ezzel párhuzamosan megtanulunk néhány más módszert is a karakterlánc felosztására, például a StringTokenenizer osztály használatát, Scanner.useDelimiter() metódus . Mielőtt rátérnénk a témára, értsük meg mi az a határoló.
Mi az a határoló?
Ban ben Jáva , határolók azok a karakterek, amelyek a karakterláncot tokenekre osztják (szétválasztják). A Java lehetővé teszi, hogy bármilyen karaktert határolóként definiáljunk. A Java számos karakterlánc-felosztási módszert kínál, amelyek szóközt használnak elválasztóként. A szóköz határoló az a alapértelmezett határoló Java nyelven.
Mielőtt áttérnénk a programra, értsük meg a karakterlánc fogalmát.
A karakterlánc kétféle szövegből áll, amelyek tokenek és határolók. A jelzők azok a szavak, amelyek értelmesek, a határolók pedig azok a karakterek, amelyek szétválasztják vagy elválasztják a jelzőket. Értsük meg egy példán keresztül.
Hogy megértsük a határoló a Java nyelven , meg kell barátkoznunk a Java reguláris kifejezés . Ez akkor szükséges, ha a határolót speciális karakterként használjuk a reguláris kifejezésekben, például (.) és (|).
Példa határolóra
Húr: A Javatpoint a legjobb webhely az új technológiák elsajátítására.
A fenti karakterláncban a tokenek a következők: Javapoint, a, legjobb, weboldal, új technológiák megismeréséhez , a határolók pedig szóközök a két token között.
Hogyan lehet felosztani egy karakterláncot Java-ban határolóval?
A Java a következő módot kínálja egy karakterlánc tokenekre való felosztására:
- A metódus használata
- A String.split() metódus használata
- StringTokenenizer osztály használata
A metódus használata
Ez a Scanner osztály metódusa. Megkeresi és visszaadja a következő tokent a szkennerből. A karakterláncot tokenekre osztja szóközelválasztóval. A teljes tokent a határoló mintának megfelelő bemenet azonosítja.
public String next();
Ez dob NoSuchElementException ha a következő token nem elérhető. Az is dob IllegalStateException ha a bemeneti szkenner le van zárva.
Hozzunk létre egy programot, amely feloszt egy karakterlánc objektumot a next() metódussal, amely szóközt használ a karakterlánc tokenekre történő felosztására.
import java.util.Scanner; public class SplitStringExample1 { public static void main(String[] args) { //declaring a string String str='Javatpoint is the best website to learn new technologies'; //constructor of the Scanner class Scanner sc=new Scanner(str); while (sc.hasNext()) { //invoking next() method that splits the string String; //prints the separated tokens System.out.println(tokens); //closing the scanner sc.close(); } } }
Javatpoint is the best website to learn new technologies
A fenti programban érdemes észrevenni, hogy a Scanner osztály konstruktorában a átadása helyett egy str string változót adtunk át. Azért tettük ezt, mert a karakterlánc manipulálása előtt el kell olvasnunk a karakterláncot.
A String.split() metódus használata
A hasított() módszere a Húr osztály egy karakterlánc felosztására szolgál String objektumok tömbjére a megadott határoló alapján, amely megfelel a reguláris kifejezésnek. Vegyük például a következő karakterláncot:
String str= 'Welcome,to,the,word,of,technology';
A fenti karakterláncot vessző választja el. A fenti karakterláncot a következő kifejezéssel oszthatjuk fel:
String[] tokens=s.split(',');
A fenti kifejezés tokenekre bontja a karakterláncot, ha a tokeneket meghatározott határoló karakter vesszővel (,) választja el. A megadott karakterlánc a következő karakterlánc-objektumokra oszlik:
Welcome to the word of technology
A split() metódusoknak két változata van:
- felosztás (karakterlánc reguláris kifejezés)
- felosztás (String regex, int limit)
String.split (karakterlánc reguláris kifejezés)
A karakterláncot a megadott reguláris kifejezésnek megfelelően osztja fel. Használhatunk pontot (.), szóközt ( ), vesszőt (,) és bármilyen karaktert (például z, a, g, l stb.)
public String[] split(String regex)
A metódus egy határoló reguláris kifejezést elemez argumentumként. String objektumok tömbjét adja vissza. Ez dob PatternSyntaxException ha az elemzett reguláris kifejezés szintaxisa érvénytelen.
Használjuk a split() metódust, és vesszővel osszuk fel a karakterláncot.
A fenti példában a karakterlánc objektumot vessző választja el. A split() metódus felosztja a karakterláncot, amikor a vesszőt találja elválasztóként.
Lássunk egy másik példát, amelyben több határolót fogunk használni a karakterlánc felosztására.
String.split(karakterlánc reguláris kifejezés, int korlát)
Lehetővé teszi számunkra, hogy a határolóval megadott karakterláncot korlátozott számú tokenre bontsuk. A módszer két paramétert fogad el: regex (egy határoló reguláris kifejezés) és limit. A limit paraméterrel szabályozható, hogy hányszor kerüljön alkalmazásra az eredményül kapott tömböt befolyásoló minta. Visszaadja a String objektumok tömbjét, amelyet az adott karakterlánc felosztásával számítanak ki a limit paraméter szerint.
A split() metódusok változata között van egy kis különbség, hogy korlátozza a metódus meghívása után visszaadott tokenek számát.
public String[] split(String regex, int limit)
Ez dob PatternSyntaxException ha az elemzett reguláris kifejezés szintaxisa érvénytelen.
A határérték lehet pozitív, negatív vagy egyenlő a határértékkel.
A fenti kódrészletben azt látjuk, hogy:
- Ha a korlát 2, a karakterlánc tömbben lévő tokenek száma kettő.
- Ha a határ -3, a megadott karakterlánc 2 tokenre lesz felosztva. Tartalmazza a záró tereket.
- Ha a határérték 0, a megadott karakterlánc 2 tokenre lesz felosztva. Ebben az esetben a záró szóköz kimarad.
Példa a csővel határolt karakterláncra
A csővel (|) határolt karakterlánc felosztása kissé körülményes. Mivel a pipe egy speciális karakter a Java reguláris kifejezésben.
Hozzunk létre egy csővel határolt karakterláncot, és osszuk fel csővel.
A fenti példában azt látjuk, hogy nem produkál ugyanazt a kimenetet, mint a többi határoló hozam. Egy sor tokenek kell létrehoznia, élet, tiéd, és Teremtés , de ez nem. Megadja az eredményt, amint azt a fenti kimenetben láttuk.
Ennek az az oka, hogy a reguláris kifejezés motorja a csőhatárolót a Logikai VAGY operátor . A regex motor felosztja a karakterláncot az üres karakterláncra.
A probléma megoldásához meg kell menekülni a pipe karakter, amikor átadjuk a split() metódusnak. A következő utasítást használjuk a pipe karakter kilépésére:
String[] stringarray = s.split('\|');
Adj hozzá egy párat fordított perjel (\) a határoló előtt, hogy kiszabaduljon a csőből. A fenti programban a változtatások elvégzése után a regex motor a cső karaktert határolóként értelmezi.
Egy másik módja annak, hogy elkerülje a pipa karaktert, ha a pipa karaktert egy pár szögletes zárójelbe helyezi, az alábbiak szerint. A Java regex API-ban a szögletes zárójelpár karakterosztályként működik.
String[] stringarray = s.split('[|]');
Mindkét fenti állítás a következő kimenetet adja:
Life is your creation
StringTokenenizer osztály használata
Jáva StringTokenizer egy örökölt osztály, amely a java.util csomagban van definiálva. Lehetővé teszi számunkra, hogy a karakterláncot tokenekre bontsuk. A programozó nem használja, mert a String osztály split() metódusa ugyanazt a munkát végzi. Tehát a programozó a split() metódust részesíti előnyben a StringTokenenizer osztály helyett. Az osztály következő két metódusát használjuk:
A metódus ismétlődik a karakterláncon, és ellenőrzi, hogy van-e több token a tokenizáló karakterláncban. Igazat ad vissza, ha az aktuális pozíció után egy token áll rendelkezésre a karakterláncban, egyébként false értéket ad vissza. Belsőleg hívja a nextToken() metódus, ha igazat ad vissza, a nextToken() metódus pedig a tokent.
public boolean hasMoreTokens()
Visszaadja a következő tokent a karakterlánc tokenizátorból. Ez dob NoSuchElementException ha a tokenek nem állnak rendelkezésre a string tokenizerben.
public String nextToken()
Hozzunk létre egy programot, amely a StringTokenenizer osztály segítségével felosztja a karakterláncot.
import java.util.StringTokenizer; public class SplitStringExample6 { public static void main(String[] args) { //defining a String object String str = 'Welcome/to/Javatpoint'; //constructor of the StringTokenizer class StringTokenizer tokens = new StringTokenizer(str, '/'); //checks if the string has more tokens or not while (tokens.hasMoreTokens()) { //prints the tokens System.out.println(tokens.nextToken()); } } }
Welcome to Javatpoint
A Scanner.useDelimiter() metódus használata
Jáva Scanner osztály biztosítja a UseElimiter() módszer a karakterlánc tokenekre való felosztására. A useDelimiter() metódusnak két változata van:
- useHatároló (minta minta)
- UseElimiter (karakterlánc minta)
useHatároló (minta minta)
A módszer a szkenner határoló mintáját a megadott karakterláncra állítja be. Egy határoló mintát elemez argumentumként. Visszaadja a szkennert.
public Scanner useDelimiter(Pattern pattern)
UseElimiter (karakterlánc minta)
A módszer a lapolvasó határoló mintáját egy olyan mintára állítja be, amely a megadott karakterláncból konstruál. Egy határoló mintát elemez argumentumként. Visszaadja a szkennert.
public Scanner useDelimiter(String pattern)
Megjegyzés: Mindkét fenti metódus ugyanúgy működik, mint a useDelimiter(Pattern.compile(pattern)) meghívása.
A következő programban a useDelimiter() metódust használtuk a karakterlánc felosztására.
import java.util.Scanner; public class SplitStringExample7 { public static void main(String args[]) { //construtor of the Scanner class Scanner scan = new Scanner('Do/your/work/self'); //Initialize the string delimiter scan.useDelimiter('/'); //checks if the tokenized Strings has next token while(scan.hasNext()) { //prints the next token System.out.println(; } //closing the scanner scan.close(); } }
Do your work self