devi into python 笔记(六)正则表达式 原始字符串

2022-11-15,,,

字符串函数replace:

    #string.replace:
#字符串的replace方法:替换子串,不改变原来的字符串
s = "broad road"
#打印出来会发现不单单是road被替换了,broad也变了
#这是因为broad也包含road,replace方法
print s.replace('road', 'rd.')

原始字符串 r'string':

    #原始字符串:只要在普通字符串前加上 r 就可以
#这样做是表明这个字符串中的所有字符都不转义,避免反斜线灾难
print r'this is a \t\n string'
#原始字符串在正则表达式中很重要

Python正则表达式:

   #Python的正则包
#$:匹配字符串末尾的,相对应的匹配字符串开头的是 ^
s = 'broad road'
#re.sub(pattern, str1, str2):将str2中符合pattern的串替换为str1
print re.sub('road$', 'rd.', s)
#但如果末尾是broad呢,很遗憾,也会被替换
s = 'broad broad'
print re.sub('road$', 'rd.', s) #\b:单词的边界必须在这里
#这样不论road出现在哪里,只要是整个的单词就会匹配
s = 'broad road room1'
print re.sub(r'\broad\b', 'rd.', s)

re.search(pattern, string): pattern正则表达式 string 要匹配的字符

    import re
#re.search(pattern, string):re包重要的函数
#pattern:正则 string:要匹配的字符串
#返回值:不能匹配返回None 匹配成功返回一堆描述,反正不是None,根据一切皆对象姑且称之为'匹配成功对象'
#^匹配开始,$匹配结束 ?匹配0个或1个M
pattern = '^M?M?M?$'
print re.search(pattern, 'M')
print re.search(pattern, 'MMMM') #|匹配前后两个表达式,先匹配左边的表达式,一旦成功匹配就不去匹配右边的表达式。
#记住(A|B|C)含义是:精确匹配ABC中的一个,匹配一个后便不再匹配其他的了
#如果不加括号,则其作用范围就是整个正则表达式
pattern = '^M?M?M?(CM|CD|D?C?C?C?)$'
print re.search(pattern, 'MCM')
print re.search(pattern, 'MCMC') #{m}匹配前面字符m次
#{m, n}匹配前面的字符m次至n次,m n都可以为0
pattern = '^M{0,3}$'
print re.search(pattern, 'M')
print re.search(pattern, 'MMMM')

松散正则表达式: re.VERBOSE 、 re.compile().search().groups()

    #松散正则表达式re.VERBOSE
#1忽略空白:比如空格制表符回车等,也就是说可以在表达式的任意地方添加任意多的空白。
#2忽略注释:这样就可以在合适的位置加上注释提高可读性。
pattern = """
^ #在这里匹配开始
M{0,3} #匹配0-3个M
(CM|CD|D?C?C?C?) #匹配xxx
$ #在这里匹配结束
"""
#使用松散正则,要给search一个re.VERBOSE表明这是一个松散正则
print re.search(pattern, 'MCM')
print re.search(pattern, 'MCM', re.VERBOSE)
print re.search(pattern, 'MCMC', re.VERBOSE)
#如果要在松散正则中匹配空白而不是被忽略掉,就要用转移字符来做
pattern = """
ab\ cd
"""
#这表示要在b和c之间匹配一个空格
print re.search(pattern, 'ab cd', re.VERBOSE) #compile 和 groups 简单使用
   #re.compile():接受一个正则表达式返回一个正则对象
pattern = re.compile(r'^(\d{3})-(\d{3})-(\d{4})$')
#正则对象的search()方法匹配同re.search()类似,接受一个正则表达式,匹配失败返回None,成功返回'匹配成功对象'
   #'匹配成功对象'.gourps()返回一个tuple,元素对应于前面正则表达式中的组。一个小括号即使一个组
   #匹配成功返回的'匹配成功对象'才能调用groups,因为匹配失败返回None,是没有groups()函数的
print pattern.search('800-555-1212').groups()

devi into python 笔记(六)正则表达式 原始字符串的相关教程结束。

《devi into python 笔记(六)正则表达式 原始字符串.doc》

下载本文的Word格式文档,以方便收藏与打印。