A rendszeres kifejezés (regex) olyan karaktersorozat, amely meghatározza a keresési mintát. Így lehet rendszeres kifejezéseket írni:
hármas tél
- Kezdje azzal, hogy megérti a Regexben használt speciális karaktereket, például ''. '*' '+' '?' És még sok más.
- Válasszon olyan programozási nyelvet vagy eszközt, amely támogatja a regexet, például a Python Perl -t vagy a GREP -t.
- Írja be a mintát a speciális karakterek és a szó szerinti karakterek segítségével.
- Használja a megfelelő funkciót vagy módszert a minta keresésére egy karakterláncban.
Példák:
- A szó szerinti karakterek sorozatának illesztése érdekében egyszerűen írja ezeket a karaktereket a mintába.
- Hogy egyetlen karakterhez illeszkedjen a lehetőségek sorozatából, használjon négyzet alakú zárójeleket, pl. [0123456789] megegyezik a számjegyekkel.
- Az előző kifejezés nulla vagy annál több előfordulásához használja a csillag (*) szimbólumot.
- Az előző kifejezés egy vagy több előfordulásának megfeleléséhez használja a Plus (+) szimbólumot.
- Fontos megjegyezni, hogy a regex összetett és nehezen olvasható, ezért ajánlott olyan eszközöket használni, mint a Regex Testers a minták hibakereséséhez és optimalizálásához.
A rendszeres kifejezés (amelyet néha racionális kifejezésnek hívnak) olyan karakterek sorozata, amelyek elsősorban a keresési mintát határozzák meg a mintákhoz való felhasználáshoz, a karakterláncokkal vagy a karakterláncokkal, azaz a „Keressen és cserélj” hasonló műveleteket. A rendszeres kifejezések egy általános módszer, amellyel a mintáknak a karakterkészletekhez igazíthatók. Minden programozási nyelven használják, például a C ++ Java és a Python.
Mi az a rendszeres kifejezés, és mi teszi ezt annyira fontosnak?
A regexet használják Google Analytics Az URL -illesztés során a keresés és a legnépszerűbb szerkesztők helyettesítésében, például a Sublime Notepad ++ zárójelben a Google Docs és a Microsoft Word.
Example : Regular expression for an email address :
^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{25})$
A fenti szabályos kifejezés felhasználható annak ellenőrzésére, hogy egy adott karakterkészlet e -mail cím -e vagy sem.
Hogyan lehet rendszeres kifejezéseket írni?
Vannak bizonyos elemek, amelyek az alábbiakban említett rendszeres kifejezések írásához használják:
1. Repeaters (* + és {})
Ezek a szimbólumok ismétlőkként működnek, és azt mondják a számítógépnek, hogy az előző karaktert csak egyszer kell használni.
2. A csillag szimbólum ( *)
Azt mondja a számítógépnek, hogy megfeleljen az előző karakternek (vagy karakterkészletnek) 0 vagy több alkalommal (egészen végtelen).
Example : The regular expression ab*c will give ac abc abbc abbbc….and so on 3. A plusz szimbólum ( +)
Azt mondja a számítógépnek, hogy ismételje meg az előző karaktert (vagy karakterkészletet) egy vagy több alkalommal (a végtelenig).
Example : The regular expression ab+c will give abc abbc
abbbc … and so on.
4. A göndör nadrágtartók {…}
Azt mondja a számítógépnek, hogy ismételje meg az előző karaktert (vagy karakterkészletet) annyiszor, mint a tartóban lévő érték.
Example : {2} means that the preceding character is to be repeated 2
times {min} means the preceding character is matches min or more
times. {minmax} means that the preceding character is repeated at
least min & at most max times.
5. helyettesítő karakter (.)
A DOT szimbólum bármely más szimbólum helyettesítheti, ezért hívják a helyettesítő karakter karakterének.
Example :
The Regular expression .* will tell the computer that any character
can be used any number of times.
6. Opcionális karakter (?)
Ez a szimbólum azt mondja a számítógépnek, hogy az előző karakter lehet vagy nem jelenik meg a megfelelő karakterláncban.
Example :
We may write the format for document file as – docx?
The ‘?’ tells the computer that x may or may not be
present in the name of file format.
7. A Caret ( ^) szimbólum ( A mérkőzés helyzetének beállítása)
A Caret szimbólum azt mondja a számítógépnek, hogy a mérkőzésnek a karakterlánc vagy a vonal elején kell kezdődnie.
Example : ^d{3} will match with patterns like '901' in '901-333-'.8. A dollár ($) szimbólum
Azt mondja a számítógépnek, hogy a mérkőzésnek a karakterlánc végén vagy az N előtt a sor vagy a karakterlánc végén kell megtörténnie.
Example : -d{3}$ will match with patterns like '-333' in '-901-333'.9. Karakterosztályok
A karakterosztály megegyezik a karakterkészlettel. Arra használják, hogy megfeleljen a nyelv legalapvetőbb elemének, mint például egy betű egy számjegy egy szimbólum stb.
S : Megfelel minden szóköz karakter, például a Space és a Tab.
S : Megfelel minden nem Whitespace karakternek.
D : Megfelel minden számjegy -karakternek.
D: Megfelel minden számjegyű karakternek.
-Ben : Bármely szófigurának megegyezik (alapvetően alfa-numerikus)
-Ben : Megfelel minden nem szó karakternek.
b .
[set_of_characters]: Bármely karakter megegyezik a SET_OF_CHARACTERS -ben. Alapértelmezés szerint a mérkőzés eset-érzékeny.
Example : [abc] will match characters ab and c in any string.10. [^set_of_characters] Tagadás:
Megfelel minden olyan karaktert, amely nincs a set_of_characters -ben. Alapértelmezés szerint a mérkőzés eset-érzékeny.
Example : [^abc] will match any character except abc .11. [Első-Last] Karaktertartomány:
Megfelel minden egyetlen karakternek az első és az utolsó között.
Example : [a-zA-z] will match any character from a to z or A to Z.12. A menekülési szimbólum ()
Ha meg akarja illeszteni a tényleges '+' '. Stb. Karaktereket, adj hozzá egy backslash () a karakter előtt. Ez azt fogja mondani a számítógépnek, hogy a következő karaktert keresési karakterként kezelje, és fontolja meg azt egy megfelelő mintát.
Example : d+[+-x*]d+ will match patterns like '2+2'
and '3*9' in '(2+2) * 3*9'.
13. Karakterek csoportosítása ()
A rendszeres kifejezés különböző szimbólumainak csoportja csoportosítható, hogy egyetlen egységként viselkedjen, és blokkként viselkedjen ehhez.
Example : ([A-Z]w+) contains two different elements of the regular
expression combined together. This expression will match any pattern
containing uppercase letter followed by any character.
14. függőleges sáv (|)
Megegyezik a függőleges sáv (|) karakterrel elválasztott elemekhez.
Example : th(e|is|at) will match words - the this and that.15. szám
BackReference: Lehetővé teszi, hogy egy korábban illeszkedő al-expresszió (kifejezés rögzítve vagy körkörös zárójelekbe zárva) később azonosítsa ugyanazon a normál kifejezésben. N azt jelenti, hogy az N-TH-zárójelbe mellékelt csoportot az aktuális helyzetben megismételik.
Example : ([a-z])1 will match ee in Geek because the character
at second position is same as character at position 1 of the match.
16. Hogyan (?# Megjegyzés)
Inline megjegyzés: A megjegyzés az első záró zárójelben ér véget.
Example : bA(?#This is an inline comment)w+b17. # [A vonal végéig]
X-módú megjegyzés. A megjegyzés egy szüntesített # -nél kezdődik, és a sor végéig folytatódik.
Example : (?x)bAw+b#Matches words starting with A