掌握Python 正则表达式中的特殊字符

大家好，我是考100分的小小码，祝大家学习进步，加薪顺利呀。今天说一说掌握Python 正则表达式中的特殊字符,希望您对编程的造诣更进一步.

正则表达式是一种强大的文本模式匹配工具，常用于字符串的匹配、替换、分割等操作。Python内置re模块提供了丰富的正则表达式方法。但是，正则表达式中有许多特殊字符需要特殊处理，掌握这些特殊字符对于使用正则表达式是非常重要的。

一、元字符

元字符是正则表达式中最基本的概念。Python中最常用的元字符包括：.、^、$、*、+、?、{}、|、[]、()。下面我们详细说明这些元字符。

. （点号）

点号可以匹配任意单个字符，但是不能匹配换行符（\n）。例如，正则表达式 a.b 可以匹配字符串 “acb”、”a2b”、”a#b” 等，但不能匹配 “a
b”。

^ （脱字符）

脱字符匹配字符串的开头。例如，正则表达式 ^a 匹配以字母 a 开头的字符串，但是不能匹配 aaaaaa。

$ （美元符号）

美元符号匹配字符串的结尾。例如，正则表达式 a$ 匹配以字母 a 结尾的字符串，但是不能匹配 aaaaaa。

* （星号）

星号表示匹配前面的字符0次或多次。例如，正则表达式 a*b 可以匹配 “b”、”ab”、”aab” 等字符串。

+ （加号）

加号表示匹配前面的字符1次或多次。例如，正则表达式 a+b 可以匹配 “ab”、”aab” 等字符串，但是不能匹配字符串 “b”。

? （问号）

问号表示匹配前面的字符0次或1次。例如，正则表达式 a?b 可以匹配 “b” 和 “ab”两个字符串。

{m,n}

大括号表示匹配前面的字符m次到n次（包括m和n）。例如，正则表达式 a{2,4}b 可以匹配 “aab”、”aaab”、”aaaab” 三个字符串。

| （管道符号）

管道符号表示“或”关系。例如，正则表达式 a|b 可以匹配 “a” 或 “b”。

[] （字符集）

字符集表示匹配方括号中任意一个字符。例如，正则表达式 [abc] 表示匹配字符 “a”、”b” 或 “c”。

() （分组）

圆括号表示将其中的字符看成一个整体，可以在其中使用|、*、+、?、{}等元字符。例如，正则表达式 (ab)+ 可以匹配 “ab”、”abab”、”ababab” 等字符串。

二、转义字符

在正则表达式中，有些特殊字符需要用反斜杠进行转义才能正确匹配。Python中最常用的转义字符包括：\d、\D、\s、\S、\w、\W、\b、\B、\\。

\d 表示匹配所有数字。例如，正则表达式 \d+ 可以匹配任意一个数字串。

\D 表示匹配所有非数字字符。例如，正则表达式 \D+ 可以匹配任意一个非数字串。

\s 表示匹配所有空白字符，包括空格、制表符、换行符等。例如，正则表达式 \s+ 可以匹配任意一个空白符串。

\S 表示匹配所有非空白字符。例如，正则表达式 \S+ 可以匹配任意一个非空白符串。

\w 表示匹配所有字母、数字和下划线。例如，正则表达式 \w+ 可以匹配任意一个标识符。

\W 表示匹配所有非字母、数字和下划线的字符。例如，正则表达式 \W+ 可以匹配任意一个非标识符。

\b 表示匹配单词的边界。例如，正则表达式\b\w+\b 可以匹配任意一个单词。

\B 表示匹配非单词边界。例如，正则表达式\Bcat\B 可以匹配 “concat”、”cat123” 等字符串。

用于转义字符本身。例如，正则表达式 \\+ 可以匹配一个反斜杠。

三、贪婪匹配和非贪婪匹配

正则表达式中的元字符默认是“贪婪”的，即尽可能多地匹配字符。例如，正则表达式 A.*B 可以匹配字符串 “A1B2C3D4B” 中的 A1B2C3D4。

非贪婪匹配也称为懒惰匹配或最小匹配，即尽可能少地匹配字符。在贪婪匹配的元字符后面加上?即可实现非贪婪匹配。例如，正则表达式 A.*?B 可以匹配字符串 “A1B2C3D4B” 中的 A1B2。

四、示例代码

import re

# 元字符示例
pattern = "a.b"
print(re.match(pattern, "acb")) # 匹配成功
print(re.match(pattern, "a 
 b")) # 匹配失败

pattern = "^a"
print(re.match(pattern, "abcd")) # 匹配成功
print(re.match(pattern, "bcda")) # 匹配失败

pattern = "a$"
print(re.match(pattern, "abcd")) # 匹配失败
print(re.match(pattern, "bcda")) # 匹配成功

pattern = "a*b"
print(re.match(pattern, "b")) # 匹配成功
print(re.match(pattern, "abab")) # 匹配成功
print(re.match(pattern, "c")) # 匹配失败

pattern = "a+b"
print(re.match(pattern, "ab")) # 匹配成功
print(re.match(pattern, "aab")) # 匹配成功
print(re.match(pattern, "b")) # 匹配失败

pattern = "a?b"
print(re.match(pattern, "b")) # 匹配成功
print(re.match(pattern, "ab")) # 匹配成功
print(re.match(pattern, "ac")) # 匹配失败

pattern = "a{2,4}b"
print(re.match(pattern, "aab")) # 匹配成功
print(re.match(pattern, "aaab")) # 匹配成功
print(re.match(pattern, "aaaab")) # 匹配成功
print(re.match(pattern, "ab")) # 匹配失败

pattern = "a|b"
print(re.match(pattern, "a")) # 匹配成功
print(re.match(pattern, "b")) # 匹配成功
print(re.match(pattern, "c")) # 匹配失败

pattern = "[abc]"
print(re.match(pattern, "a")) # 匹配成功
print(re.match(pattern, "b")) # 匹配成功
print(re.match(pattern, "d")) # 匹配失败

pattern = "(ab)+"
print(re.match(pattern, "ababab")) # 匹配成功
print(re.match(pattern, "ab")) # 匹配成功
print(re.match(pattern, "ac")) # 匹配失败

# 转义字符示例
pattern = "\d+"
print(re.match(pattern, "123abc")) # 匹配成功
print(re.match(pattern, "abc")) # 匹配失败

pattern = "\D+"
print(re.match(pattern, "123abc")) # 匹配失败
print(re.match(pattern, "abc")) # 匹配成功

pattern = "\s+"
print(re.match(pattern, "   abc")) # 匹配成功
print(re.match(pattern, "abc")) # 匹配失败

pattern = "\S+"
print(re.match(pattern, "   abc")) # 匹配失败
print(re.match(pattern, "abc")) # 匹配成功

pattern = "\w+"
print(re.match(pattern, "def_123")) # 匹配成功
print(re.match(pattern, "!@#")) # 匹配失败

pattern = "\W+"
print(re.match(pattern, "def_123")) # 匹配失败
print(re.match(pattern, "!@#")) # 匹配成功

pattern = r"\b\w+\b"
print(re.findall(pattern, "Hello, world!")) # ['Hello', 'world']

pattern = r"\Bcat\B"
print(re.search(pattern, "concat")) # None
print(re.search(pattern, "cat123")) # None

# 贪婪匹配和非贪婪匹配示例
pattern = "A.*B"
print(re.match(pattern, "A1B2C3D4B")) # 匹配成功

pattern = "A.*?B"
print(re.match(pattern, "A1B2C3D4B")) # 匹配成功

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
转载请注明出处: https://daima100.com/23000.html

掌握Python 正则表达式中的特殊字符

一、元字符

二、转义字符

三、贪婪匹配和非贪婪匹配

四、示例代码

相关推荐

发表回复