പൈത്തൺ 3-നുള്ള റീ മൊഡ്യൂളിനുള്ള ഡോക്യുമെന്റേഷൻ. റെഗുലർ എക്‌സ്‌പ്രഷനുകൾക്കായുള്ള മൊഡ്യൂൾ

ഉള്ളടക്കം

പതിവ് പദപ്രയോഗങ്ങൾ: ഒരു ആമുഖം
- റീ ലൈബ്രറിയിലെ ഒരു ടെംപ്ലേറ്റ് എന്താണ്?
പതിവ് എക്സ്പ്രഷനുകൾ ഉപയോഗിച്ച് വ്യത്യസ്ത സ്ട്രിംഗുകളിൽ നിന്ന് പ്രത്യേക വിവരങ്ങൾ നേടുന്നു
മൂന്ന് ഫംഗ്ഷനുകളുള്ള പൊരുത്തങ്ങൾ കണ്ടെത്തുന്നു
- re.findall()
- re.search() vs re.match()
ടെക്സ്റ്റിന്റെ ഒരു ഭാഗം റീ ലൈബ്രറി ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുന്നു
റെഗുലർ എക്സ്പ്രഷൻ ഗ്രൂപ്പുകൾ എന്തൊക്കെയാണ്?
"അത്യാഗ്രഹ" പൊരുത്തം എന്ന ആശയം
ജനപ്രിയ എക്സ്പ്രഷൻ ടെംപ്ലേറ്റുകൾ
തീരുമാനം

മിക്കവാറും എല്ലാ പ്രോഗ്രാമിംഗ് ഭാഷകളുടെയും വളരെ ജനപ്രിയമായ ഘടകമാണ് റെഗുലർ എക്സ്പ്രഷനുകൾ. നിങ്ങൾക്ക് ആവശ്യമുള്ള വിവരങ്ങൾ വേഗത്തിൽ ആക്സസ് ചെയ്യാൻ അവ നിങ്ങളെ സഹായിക്കുന്നു. പ്രത്യേകിച്ചും, ടെക്സ്റ്റ് പ്രോസസ്സ് ചെയ്യേണ്ടത് ആവശ്യമുള്ളപ്പോൾ അവ ഉപയോഗിക്കുന്നു. പൈത്തൺ സ്ഥിരസ്ഥിതിയായി ഒരു പ്രത്യേക മൊഡ്യൂളുമായി വരുന്നു. re, പതിവ് എക്സ്പ്രഷനുകൾക്കൊപ്പം പ്രവർത്തിക്കാൻ ഇത് ഉത്തരവാദിയാണ്.

ഇന്ന് നമ്മൾ പൊതുവായി എന്താണെന്നതിനെക്കുറിച്ച് വിശദമായി സംസാരിക്കും, അവരുമായി എങ്ങനെ പ്രവർത്തിക്കണം, എങ്ങനെ മൊഡ്യൂൾ re സഹായിക്കും.

പതിവ് പദപ്രയോഗങ്ങൾ: ഒരു ആമുഖം

സാധാരണ പദപ്രയോഗങ്ങളുടെ ഉപയോഗങ്ങൾ എന്തൊക്കെയാണ്? മിക്കവാറും എല്ലാ. ഉദാഹരണത്തിന്, ഇവ:

ടെക്സ്റ്റ് മൂല്യനിർണ്ണയം ആവശ്യമുള്ള വെബ് ആപ്ലിക്കേഷനുകൾ. ഒരു സാധാരണ ഉദാഹരണം ഓൺലൈൻ മെയിൽ ക്ലയന്റുകളാണ്.
ടെക്‌സ്‌റ്റുകൾ, ഡാറ്റാബേസുകൾ തുടങ്ങിയവയുമായി ബന്ധപ്പെട്ട മറ്റേതെങ്കിലും പ്രോജക്‌റ്റുകൾ.

വാക്യഘടന പാഴ്‌സ് ചെയ്യാൻ തുടങ്ങുന്നതിനുമുമ്പ്, ലൈബ്രറിയുടെ പ്രവർത്തനത്തിന്റെ അടിസ്ഥാന തത്വങ്ങൾ കൂടുതൽ വിശദമായി മനസ്സിലാക്കണം. re പൊതുവേ, അതിൽ പൊതുവെ എന്താണ് നല്ലത്. യഥാർത്ഥ പരിശീലനത്തിൽ നിന്നുള്ള ഉദാഹരണങ്ങളും ഞങ്ങൾ നൽകും, അവിടെ അവയുടെ ഉപയോഗത്തിന്റെ സംവിധാനം ഞങ്ങൾ വിവരിക്കും. ടെക്സ്റ്റ് ഉപയോഗിച്ച് വൈവിധ്യമാർന്ന പ്രവർത്തനങ്ങൾ നടത്താൻ നിങ്ങൾക്ക് അനുയോജ്യമായ ഒരു ടെംപ്ലേറ്റ് നിങ്ങൾക്ക് സൃഷ്ടിക്കാൻ കഴിയും.

റീ ലൈബ്രറിയിലെ ഒരു ടെംപ്ലേറ്റ് എന്താണ്?

ഇത് ഉപയോഗിച്ച്, നിങ്ങൾക്ക് മറ്റ് ഫംഗ്ഷനുകൾ കൂടുതൽ അനുയോജ്യമാക്കുന്നതിന് വിവിധ തരത്തിലുള്ള വിവരങ്ങൾക്കായി തിരയാനും അവയുമായി ബന്ധപ്പെട്ട വിവരങ്ങൾ നേടാനും കഴിയും. കൂടാതെ, തീർച്ചയായും, ഈ ഡാറ്റ പ്രോസസ്സ് ചെയ്യാൻ.

ഉദാഹരണത്തിന്, ഇനിപ്പറയുന്ന ടെംപ്ലേറ്റ് എടുക്കുക: s+. ഏത് ബഹിരാകാശ പ്രതീകവും അർത്ഥമാക്കുന്നു. നിങ്ങൾ അതിൽ ഒരു പ്ലസ് ചിഹ്നം ചേർക്കുകയാണെങ്കിൽ, പാറ്റേണിൽ ഒന്നിലധികം ഇടങ്ങൾ ഉൾപ്പെടുന്നു എന്നാണ് ഇതിനർത്ഥം. ഉപയോഗിച്ച് വിളിക്കുന്ന ടാബ് പ്രതീകങ്ങളുമായി പോലും ഇതിന് പൊരുത്തപ്പെടുത്താനാകും t+.

അവ ഉപയോഗിക്കുന്നതിന് മുമ്പ്, നിങ്ങൾ ലൈബ്രറി ഇറക്കുമതി ചെയ്യേണ്ടതുണ്ട് Re. അതിനുശേഷം, ടെംപ്ലേറ്റ് കംപൈൽ ചെയ്യുന്നതിന് ഞങ്ങൾ ഒരു പ്രത്യേക കമാൻഡ് ഉപയോഗിക്കുന്നു. ഇത് രണ്ട് ഘട്ടങ്ങളിലായാണ് ചെയ്യുന്നത്.

>>> വീണ്ടും ഇറക്കുമതി ചെയ്യുക

>>> regex = re.compile('s+')

പ്രത്യേകിച്ചും, ഈ കോഡ് ഉപയോഗിക്കാവുന്ന ഒരു ടെംപ്ലേറ്റ് കംപൈൽ ചെയ്യുന്നതിനുള്ള പ്രവർത്തനം നിർവ്വഹിക്കുന്നു. ഉദാഹരണത്തിന്, സ്പെയ്സുകൾക്കായി തിരയാൻ (ഒന്നോ അതിലധികമോ).

പതിവ് എക്സ്പ്രഷനുകൾ ഉപയോഗിച്ച് വ്യത്യസ്ത സ്ട്രിംഗുകളിൽ നിന്ന് പ്രത്യേക വിവരങ്ങൾ നേടുന്നു

ഇനിപ്പറയുന്ന വിവരങ്ങൾ ഉൾക്കൊള്ളുന്ന ഒരു വേരിയബിൾ ഞങ്ങളുടെ പക്കലുണ്ടെന്ന് കരുതുക.

>>> ടെക്സ്റ്റ് = """100 INF ഇൻഫോർമാറ്റിക്സ്

213 MAT മാത്തമാറ്റിക്സ്

156 ENG ഇംഗ്ലീഷ്»»»

ഇതിൽ മൂന്ന് പരിശീലന കോഴ്സുകൾ അടങ്ങിയിരിക്കുന്നു. അവയിൽ ഓരോന്നിനും മൂന്ന് ഭാഗങ്ങളുണ്ട് - നമ്പർ, കോഡ്, പേര്. ഈ വാക്കുകൾ തമ്മിലുള്ള ഇടവേള വ്യത്യസ്തമാണെന്ന് നാം കാണുന്നു. ഈ വരിയെ പ്രത്യേക സംഖ്യകളിലേക്കും വാക്കുകളിലേക്കും വിഭജിക്കാൻ എന്തുചെയ്യണം? ഈ ലക്ഷ്യം നേടുന്നതിന് രണ്ട് രീതികളുണ്ട്:

ഒരു ഫംഗ്ഷൻ വിളിക്കുക വീണ്ടും പിളർപ്പ്.
പ്രവർത്തനം പ്രയോഗിക്കുക രണ്ടായി പിരിയുക വേണ്ടി regex.

നമ്മുടെ വേരിയബിളിനായി ഓരോ രീതിയുടെയും വാക്യഘടന ഉപയോഗിക്കുന്നതിനുള്ള ഒരു ഉദാഹരണം ഇതാ.

>>> re.split('s+', text)

# അഥവാ

>>> regex.split(text)

ഔട്ട്‌പുട്ട്: ['100', 'INF', 'കമ്പ്യൂട്ടർ സയൻസ്', '213', 'MAT', 'ഗണിതം', '156', 'ENG', 'ഇംഗ്ലീഷ്']

പൊതുവേ, രണ്ട് രീതികളും ഉപയോഗിക്കാം. എന്നാൽ ഫംഗ്ഷൻ ഒന്നിലധികം തവണ ഉപയോഗിക്കുന്നതിന് പകരം ഒരു സാധാരണ എക്സ്പ്രഷൻ ഉപയോഗിക്കുന്നത് യഥാർത്ഥത്തിൽ വളരെ എളുപ്പമാണ്. വീണ്ടും പിളർപ്പ്.

മൂന്ന് ഫംഗ്ഷനുകളുള്ള പൊരുത്തങ്ങൾ കണ്ടെത്തുന്നു

നമുക്ക് ഒരു സ്ട്രിംഗിൽ നിന്ന് അക്കങ്ങൾ മാത്രമേ എക്‌സ്‌ട്രാക്‌റ്റ് ചെയ്യേണ്ടതുള്ളൂ എന്ന് പറയാം. ഇതിനായി എന്താണ് ചെയ്യേണ്ടത്?

re.findall()

ഫംഗ്‌ഷനുള്ള ഒരു ഉപയോഗ കേസ് ഇതാ കണ്ടുപിടിക്കുക(), സാധാരണ എക്സ്പ്രഷനുകൾക്കൊപ്പം, ഒരു ടെക്സ്റ്റ് വേരിയബിളിൽ നിന്ന് ഒന്നോ അതിലധികമോ സംഖ്യകളുടെ സംഭവവികാസങ്ങൾ വേർതിരിച്ചെടുക്കാൻ നിങ്ങളെ അനുവദിക്കുന്നു.

>>> പ്രിന്റ്(ടെക്സ്റ്റ്)

100 INF ഇൻഫോർമാറ്റിക്സ്

213 MAT മാത്തമാറ്റിക്സ്

156 ENG ഇംഗ്ലീഷ്

>>> regex_num = re.compile('d+')

>>> regex_num.findall(text)

['100', '213', '156']

d ചിഹ്നത്തോടൊപ്പം, ഒരു വേരിയബിളിലോ ടെക്‌സ്‌റ്റിലോ സ്ഥിതിചെയ്യുന്ന ഏതെങ്കിലും സംഖ്യാ മൂല്യത്തെ സൂചിപ്പിക്കുന്ന ഒരു ടെംപ്ലേറ്റ് ഞങ്ങൾ ഉപയോഗിച്ചു. ഞങ്ങൾ ഒരു + അവിടെ ചേർത്തതിനാൽ, കുറഞ്ഞത് ഒരു സംഖ്യയെങ്കിലും ഉണ്ടായിരിക്കണം എന്നാണ് ഇതിനർത്ഥം.

ഒരു പൊരുത്തം കണ്ടെത്തുന്നതിന് ഒരു അക്കത്തിന്റെ സാന്നിധ്യം ആവശ്യമില്ലെന്ന് വ്യക്തമാക്കാൻ നിങ്ങൾക്ക് * ചിഹ്നം ഉപയോഗിക്കാം.

എന്നാൽ ഞങ്ങളുടെ കാര്യത്തിൽ, ഞങ്ങൾ + ഉപയോഗിച്ചതിനാൽ, ഞങ്ങൾ എക്‌സ്‌ട്രാക്‌റ്റുചെയ്‌തു കണ്ടുപിടിക്കുക() വാചകത്തിൽ നിന്നുള്ള കോഴ്‌സുകളുടെ ഒന്നോ അതിലധികമോ ഡിജിറ്റൽ പദവികൾ. അതിനാൽ, ഞങ്ങളുടെ കാര്യത്തിൽ, പതിവ് എക്സ്പ്രഷനുകൾ ഫംഗ്ഷന്റെ ക്രമീകരണങ്ങളായി പ്രവർത്തിക്കുന്നു.

re.search() vs re.match()

ഫംഗ്ഷനുകളുടെ പേരിൽ നിന്ന് നിങ്ങൾക്ക് ഊഹിക്കാൻ കഴിയുന്നതുപോലെ, ടെക്സ്റ്റിലെ ഒരു പൊരുത്തം ആദ്യം തിരയുന്നു. ചോദ്യം: എന്താണ് തമ്മിലുള്ള വ്യത്യാസം കണ്ടുപിടിക്കണോ? പാറ്റേണുമായി പൊരുത്തപ്പെടുന്ന ഒരു നിർദ്ദിഷ്‌ട ഒബ്‌ജക്‌റ്റ് ഇത് നൽകുന്നു, മുമ്പത്തെ ഫംഗ്‌ഷൻ പോലെ ഒരു ലിസ്‌റ്റിന്റെ രൂപത്തിൽ കണ്ടെത്തിയ ഫലങ്ങളുടെ മുഴുവൻ ശ്രേണിയും നൽകുന്നില്ല എന്നതാണ് കാര്യം.

അതാകട്ടെ, re.match ഫംഗ്‌ഷനും അതുതന്നെ ചെയ്യുന്നു. വാക്യഘടന മാത്രം വ്യത്യസ്തമാണ്. ടെംപ്ലേറ്റ് തുടക്കത്തിൽ തന്നെ സ്ഥാപിക്കണം.

ഇത് തെളിയിക്കുന്ന ഒരു ഉദാഹരണം എടുക്കാം.

>>> # ടെക്‌സ്‌റ്റ് ഉപയോഗിച്ച് ഒരു വേരിയബിൾ സൃഷ്‌ടിക്കുക

>>> text2 = «»»INF ഇൻഫോർമാറ്റിക്സ്

213 MAT മാത്തമാറ്റിക്സ് 156″»»

>>> # regex കംപൈൽ ചെയ്ത് പാറ്റേണുകൾക്കായി നോക്കുക

>>> regex_num = re.compile('d+')

>>> s = regex_num.search(text2)

>>> പ്രിന്റ് ('ആദ്യ സൂചിക: ', s.start())

>>> പ്രിന്റ് ('അവസാന സൂചിക: ', s.end())

>>> പ്രിന്റ്(text2[s.start():s.end()])

ആദ്യ സൂചിക: 17

അവസാന സൂചിക: 20

213

നിങ്ങൾക്ക് മറ്റൊരു രീതിയിൽ സമാനമായ ഫലം ലഭിക്കണമെങ്കിൽ, നിങ്ങൾക്ക് ഫംഗ്ഷൻ ഉപയോഗിക്കാം ഗ്രൂപ്പ്().

ടെക്സ്റ്റിന്റെ ഒരു ഭാഗം റീ ലൈബ്രറി ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുന്നു

ടെക്സ്റ്റ് മാറ്റിസ്ഥാപിക്കാൻ, ഫംഗ്ഷൻ ഉപയോഗിക്കുക re.sub(). ഞങ്ങളുടെ കോഴ്‌സുകളുടെ ലിസ്റ്റ് അല്പം മാറിയെന്ന് കരുതുക. ഓരോ ഡിജിറ്റൽ മൂല്യത്തിനും ശേഷം നമുക്ക് ഒരു ടാബ് ഉണ്ടെന്ന് ഞങ്ങൾ കാണുന്നു. ഈ ക്രമങ്ങളെല്ലാം ഒരു വരിയിൽ സംയോജിപ്പിക്കുക എന്നതാണ് ഞങ്ങളുടെ ചുമതല. ഇത് ചെയ്യുന്നതിന്, നമ്മൾ s+ എന്ന പദപ്രയോഗം മാറ്റിസ്ഥാപിക്കേണ്ടതുണ്ട് കടന്നുപോകുക

യഥാർത്ഥ വാചകം ഇതായിരുന്നു:

# ടെക്‌സ്‌റ്റ് ഉപയോഗിച്ച് ഒരു വേരിയബിൾ സൃഷ്‌ടിക്കുക

>>> ടെക്സ്റ്റ് = """100 INF t ഇൻഫോർമാറ്റിക്സ്

213 MAT ടി മഠം

156 ENG t ഇംഗ്ലീഷ്»»»

>>> പ്രിന്റ്(ടെക്സ്റ്റ്)

100 വിവരം ഇൻഫോർമാറ്റിക്സ്

213 MAT ഗണിതം

156 എഎൻജി ഇംഗ്ലീഷ്

ആവശ്യമുള്ള പ്രവർത്തനം നടത്താൻ, ഞങ്ങൾ ഇനിപ്പറയുന്ന കോഡ് ലൈനുകൾ ഉപയോഗിച്ചു.

# ഒന്നോ അതിലധികമോ സ്‌പെയ്‌സുകൾ 1 ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുക

>>> regex = re.compile('s+')

>>> പ്രിന്റ്(regex.sub(' ', ടെക്സ്റ്റ്))

തൽഫലമായി, ഞങ്ങൾക്ക് ഒരു വരിയുണ്ട്.

101 COM കമ്പ്യൂട്ടറുകൾ 205 MAT മാത്തമാറ്റിക്സ് 189 ENG ഇംഗ്ലീഷ്

ഇപ്പോൾ മറ്റൊരു പ്രശ്നം പരിഗണിക്കുക. ഇടങ്ങൾ ഇടാനുള്ള ചുമതല ഞങ്ങൾ നേരിടുന്നില്ല. എല്ലാ കോഴ്‌സ് പേരുകളും ഒരു പുതിയ ലൈനിൽ ആരംഭിക്കുന്നത് ഞങ്ങൾക്ക് വളരെ പ്രധാനമാണ്. ഇത് ചെയ്യുന്നതിന്, ഒഴിവാക്കലിലേക്ക് ഒരു പുതിയ ലൈൻ ചേർക്കുന്ന മറ്റൊരു പദപ്രയോഗം ഉപയോഗിക്കുന്നു. ഇത് ഏത് തരത്തിലുള്ള ആവിഷ്കാരമാണ്?

ലൈബ്രറി Re നെഗറ്റീവ് പൊരുത്തപ്പെടുത്തൽ പോലുള്ള ഒരു സവിശേഷതയെ പിന്തുണയ്ക്കുന്നു. സ്ലാഷിന് മുമ്പുള്ള ഒരു ആശ്ചര്യചിഹ്നം അടങ്ങിയിരിക്കുന്നതിനാൽ ഇത് നേരിട്ടുള്ളതിൽ നിന്ന് വ്യത്യസ്തമാണ്. അതായത്, നമുക്ക് ന്യൂലൈൻ പ്രതീകം ഒഴിവാക്കണമെങ്കിൽ, n എന്നതിന് പകരം !n എന്ന് എഴുതണം.

നമുക്ക് ഇനിപ്പറയുന്ന കോഡ് ലഭിക്കും.

# ന്യൂലൈൻ ഒഴികെയുള്ള എല്ലാ ഇടങ്ങളും നീക്കം ചെയ്യുക

>>> regex = re.compile('(?!n)s+)')

>>> പ്രിന്റ്(regex.sub(' ', ടെക്സ്റ്റ്))

100 INF ഇൻഫോർമാറ്റിക്സ്

213 MAT മാത്തമാറ്റിക്സ്

156 ENG ഇംഗ്ലീഷ്

റെഗുലർ എക്സ്പ്രഷൻ ഗ്രൂപ്പുകൾ എന്തൊക്കെയാണ്?

റെഗുലർ എക്സ്പ്രഷനുകളുടെ ഗ്രൂപ്പുകളുടെ സഹായത്തോടെ, നമുക്ക് ആവശ്യമുള്ള വസ്തുക്കൾ പ്രത്യേക മൂലകങ്ങളുടെ രൂപത്തിൽ ലഭിക്കും, ഒരു വരിയിലല്ല.

നമുക്ക് കോഴ്‌സ് നമ്പറും കോഡും പേരും ഒരു വരിയിലല്ല, പ്രത്യേക ഘടകങ്ങളായി ലഭിക്കണമെന്ന് കരുതുക. ടാസ്ക് പൂർത്തിയാക്കാൻ, നിങ്ങൾ അനാവശ്യമായ കോഡ് ലൈനുകളുടെ ഒരു വലിയ എണ്ണം എഴുതേണ്ടതുണ്ട്.

വാസ്തവത്തിൽ, ചുമതല വളരെ ലളിതമാക്കാൻ കഴിയും. നിങ്ങൾക്ക് എല്ലാ എൻട്രികൾക്കും ടെംപ്ലേറ്റ് കംപൈൽ ചെയ്യാനും ബ്രാക്കറ്റിൽ നിന്ന് നിങ്ങൾക്ക് ലഭിക്കേണ്ട ഡാറ്റ വ്യക്തമാക്കാനും കഴിയും.

വരികളുടെ എണ്ണം വളരെ കുറവായിരിക്കും.

# കോഴ്‌സ് ടെക്‌സ്‌റ്റ് ടെംപ്ലേറ്റുകളുടെ ഗ്രൂപ്പുകൾ സൃഷ്‌ടിച്ച് അവ എക്‌സ്‌ട്രാക്‌റ്റ് ചെയ്യുക

>>> course_pattern = '([0-9]+)s*([A-ZY]{3})s*([a-zA-ZoY]{4,})'

>>> re.findall(course_pattern, text)

[('100', 'INF', 'കമ്പ്യൂട്ടർ സയൻസ്'), ('213', 'MAT', 'ഗണിതം'), ('156', 'ENG', 'ഇംഗ്ലീഷ്')]

"അത്യാഗ്രഹ" പൊരുത്തം എന്ന ആശയം

സ്റ്റാൻഡേർഡ് പ്രകാരം, പൊരുത്തപ്പെടുന്ന ഡാറ്റയുടെ പരമാവധി തുക എക്‌സ്‌ട്രാക്‌റ്റുചെയ്യുന്നതിന് റെഗുലർ എക്‌സ്‌പ്രഷനുകൾ പ്രോഗ്രാം ചെയ്‌തിരിക്കുന്നു. നിങ്ങൾക്ക് വളരെ കുറച്ച് ആവശ്യമുണ്ടെങ്കിൽ പോലും.

നമുക്ക് ടാഗ് ലഭിക്കേണ്ട ഒരു സാമ്പിൾ HTML കോഡ് നോക്കാം.

>>> വാചകം = “അത്യാഗ്രഹമുള്ള പതിവ് എക്സ്പ്രഷൻ പൊരുത്തത്തിന്റെ ഉദാഹരണം”

>>> re.findall('', ടെക്സ്റ്റ്)

['അത്യാഗ്രഹം പതിവായ എക്സ്പ്രഷൻ മാച്ചിംഗിന്റെ ഉദാഹരണം']

ഒരു ടാഗ് മാത്രം എക്‌സ്‌ട്രാക്റ്റ് ചെയ്യുന്നതിനുപകരം, പൈത്തണിന് മുഴുവൻ സ്ട്രിംഗും ലഭിച്ചു. അതുകൊണ്ടാണ് അതിനെ അത്യാഗ്രഹം എന്ന് വിളിക്കുന്നത്.

പിന്നെ ടാഗ് മാത്രം കിട്ടാൻ എന്ത് ചെയ്യണം? ഈ സാഹചര്യത്തിൽ, നിങ്ങൾ അലസമായ പൊരുത്തപ്പെടുത്തൽ ഉപയോഗിക്കേണ്ടതുണ്ട്. അത്തരമൊരു പദപ്രയോഗം വ്യക്തമാക്കുന്നതിന്, പാറ്റേണിന്റെ അവസാനത്തിൽ ഒരു ചോദ്യചിഹ്നം ചേർക്കുന്നു.

നിങ്ങൾക്ക് ഇനിപ്പറയുന്ന കോഡും വ്യാഖ്യാതാവിന്റെ ഔട്ട്പുട്ടും ലഭിക്കും.

>>> re.findall('', ടെക്സ്റ്റ്)

[”, ”]

ആദ്യം നേരിട്ട സംഭവം മാത്രം ലഭിക്കണമെങ്കിൽ, ഈ രീതി ഉപയോഗിക്കുന്നു തിരയുക ().

re.search('', text).group()

അപ്പോൾ ഓപ്പണിംഗ് ടാഗ് മാത്രമേ കാണൂ.

ജനപ്രിയ എക്സ്പ്രഷൻ ടെംപ്ലേറ്റുകൾ

ഏറ്റവും സാധാരണയായി ഉപയോഗിക്കുന്ന പതിവ് എക്സ്പ്രഷൻ പാറ്റേണുകൾ അടങ്ങുന്ന ഒരു പട്ടിക ഇതാ.

തീരുമാനം

പതിവ് എക്സ്പ്രഷനുകൾക്കൊപ്പം പ്രവർത്തിക്കുന്നതിനുള്ള ഏറ്റവും അടിസ്ഥാന രീതികൾ മാത്രമാണ് ഞങ്ങൾ പരിഗണിച്ചത്. ഏത് സാഹചര്യത്തിലും, അവ എത്രത്തോളം പ്രധാനമാണെന്ന് നിങ്ങൾ കണ്ടു. മുഴുവൻ ടെക്‌സ്‌റ്റും അതിന്റെ വ്യക്തിഗത ശകലങ്ങളും പാഴ്‌സ് ചെയ്യേണ്ടതുണ്ടോ, ഒരു സോഷ്യൽ നെറ്റ്‌വർക്കിലെ ഒരു പോസ്റ്റ് വിശകലനം ചെയ്യേണ്ടതുണ്ടോ അല്ലെങ്കിൽ പിന്നീട് പ്രോസസ്സ് ചെയ്യുന്നതിന് ഡാറ്റ ശേഖരിക്കേണ്ടതുണ്ടോ എന്നതിൽ ഇവിടെ വ്യത്യാസമില്ല. പതിവ് പദപ്രയോഗങ്ങൾ ഇക്കാര്യത്തിൽ വിശ്വസനീയമായ ഒരു സഹായിയാണ്.

ഇനിപ്പറയുന്നതുപോലുള്ള ജോലികൾ ചെയ്യാൻ അവ നിങ്ങളെ അനുവദിക്കുന്നു:

ഒരു ഇമെയിൽ വിലാസം അല്ലെങ്കിൽ ഫോൺ നമ്പർ പോലുള്ള ഡാറ്റയുടെ ഫോർമാറ്റ് വ്യക്തമാക്കുന്നു.
ഒരു സ്ട്രിംഗ് നേടുകയും അതിനെ നിരവധി ചെറിയ സ്ട്രിംഗുകളായി വിഭജിക്കുകയും ചെയ്യുന്നു.
തിരച്ചിൽ, ആവശ്യമായ വിവരങ്ങൾ എക്‌സ്‌ട്രാക്‌റ്റുചെയ്യൽ അല്ലെങ്കിൽ പ്രതീകങ്ങളുടെ ഭാഗം മാറ്റിസ്ഥാപിക്കൽ എന്നിങ്ങനെയുള്ള വാചകം ഉപയോഗിച്ച് വിവിധ പ്രവർത്തനങ്ങൾ നടത്തുക.

പതിവ് എക്സ്പ്രഷനുകൾ നിസ്സാരമല്ലാത്ത പ്രവർത്തനങ്ങൾ നടത്താൻ നിങ്ങളെ അനുവദിക്കുന്നു. ഒറ്റനോട്ടത്തിൽ, ഈ ശാസ്ത്രത്തിൽ വൈദഗ്ദ്ധ്യം നേടുന്നത് എളുപ്പമല്ല. എന്നാൽ പ്രായോഗികമായി, എല്ലാം സ്റ്റാൻഡേർഡ് ആണ്, അതിനാൽ ഇത് ഒരിക്കൽ കണ്ടുപിടിക്കാൻ മതിയാകും, അതിനുശേഷം ഈ ഉപകരണം പൈത്തണിൽ മാത്രമല്ല, മറ്റേതെങ്കിലും പ്രോഗ്രാമിംഗ് ഭാഷയിലും ഉപയോഗിക്കാം. എക്സൽ പോലും ഡാറ്റ പ്രോസസ്സിംഗ് ഓട്ടോമേറ്റ് ചെയ്യുന്നതിന് റെഗുലർ എക്സ്പ്രഷനുകൾ ഉപയോഗിക്കുന്നു. അതിനാൽ ഈ ഉപകരണം ഉപയോഗിക്കാതിരിക്കുന്നത് പാപമാണ്.

പൈത്തൺ 3-നുള്ള റീ മൊഡ്യൂളിനുള്ള ഡോക്യുമെന്റേഷൻ. റെഗുലർ എക്സ്പ്രഷനുകൾക്കായി വീണ്ടും മൊഡ്യൂൾ

പതിവ് പദപ്രയോഗങ്ങൾ: ഒരു ആമുഖം

റീ ലൈബ്രറിയിലെ ഒരു ടെംപ്ലേറ്റ് എന്താണ്?

പതിവ് എക്സ്പ്രഷനുകൾ ഉപയോഗിച്ച് വ്യത്യസ്ത സ്ട്രിംഗുകളിൽ നിന്ന് പ്രത്യേക വിവരങ്ങൾ നേടുന്നു

മൂന്ന് ഫംഗ്ഷനുകളുള്ള പൊരുത്തങ്ങൾ കണ്ടെത്തുന്നു

re.findall()

re.search() vs re.match()

ടെക്സ്റ്റിന്റെ ഒരു ഭാഗം റീ ലൈബ്രറി ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുന്നു

റെഗുലർ എക്സ്പ്രഷൻ ഗ്രൂപ്പുകൾ എന്തൊക്കെയാണ്?

"അത്യാഗ്രഹ" പൊരുത്തം എന്ന ആശയം

ജനപ്രിയ എക്സ്പ്രഷൻ ടെംപ്ലേറ്റുകൾ

തീരുമാനം

നിങ്ങളുടെ അഭിപ്രായങ്ങൾ രേഖപ്പെടുത്തുക