正则表达式RegExp语法与用法详解

2022-10-22,,,,

正则表达式的定义和用途

正则表达式用于定义一些字符串的规则。计算机可以根据正则表达式,来检查一个字符串是否符合指定的规则,或者将字符串中符合规则的内容提取出来。

regexp的意思是 regular expression。使用typeof检查正则对象,会返回object。

创建正则表达式

方式一:使用构造函数创建

使用构造函数创建时,更加灵活,因为参数中还可以传递变量。

	var 变量 = new regexp("正则表达式"); // 注意,参数是字符串
	var 变量 = new regexp("正则表达式", "匹配模式"); // 注意,两个参数都是字符串

匹配模式作为第二个参数。这个参数可以是:

  • i 忽略大小写。这里的 i 指的是 ignore。
  • g 全局匹配模式。这里的 g 指的是 global。
var reg = new regexp("a"); // 定义一个正则表达式:检查一个字符串中是否含有 a
 
var reg = new regexp('a', 'i');
var str = 'qiangu';
 
console.log(reg.test(str)); // 打印结果:true

方式二:使用字面量创建

	var 变量 = /正则表达式/;  // 注意,这个语法里没有引号
 
	var 变量 = /正则表达式/匹配模式;  // 注意,这个语法里没有引号
	var reg = /a/i; // 定义正则表达式的规则:检查一个字符串中是否含有 a。忽略大小写。
	var str = "qiangu";
 
	console.log(typeof reg);  // 打印结果:object
	console.log(reg.test(str)); // 打印结果:true

正则表达式的语法

匹配字符

字符 描述
. 匹配任意单个字符除了换行符
[ ] [ ] 内为字符集,匹配 [ ] 内任一字符
[^ ] 匹配除了方括号里的任意字符
* 匹配 >= 0 个 * 号前的字符。
+ 匹配 >= 1 个+号前的字符。
? 匹配 0 或 1 个 ?号前的字符。
{n,m} 匹配n到m个大括号之前的字符或字符集
(xyz) 匹配与 xyz 完全相等的字符串
| 或运算符,匹配|符号前或后的字符
\s 匹配空格
\ 转义字符,匹配一些保留的字符 [ ] ( ) { } . * + ? ^ $ \ |
^ 从开始行开始匹配
$ 从末端开始匹配
  • /[ab]/ 等价于 /a|b/:检查一个字符串中是否包含 a或b
  • /[a-z]/:检查一个字符串那种是否包含任意小写字母
  • /[a-z]/:任意大写字母
  • /[a-z]/:任意字母
  • /[0-9]/:任意数字
  • /a[bde]c/:检查一个字符串中是否包含 abc 或 adc 或 aec
  • [tt]he 匹配 the 和 the
  • [^c]ar 匹配一个后面跟着ar的除了c的任意字符,如匹配par,不匹配car
  • [a-z]* 匹配一个行中所有以小写字母开头的字符串。
"[a-z]*" => the car parked in the garage

c.+t 匹配以首字母c开头以t结尾,中间跟着至少一个字符的字符串

"c.+t" => the fat cat sat on the mat
  • [t]?he 匹配字符串 he 和 the
  • [0-9]{2,3} 匹配最少 2 位最多 3 位 0~9 的数字
  • 可以省略第二个参数。 例如,[0-9]{2,} 匹配至少两位 0~9 的数字。
  • 逗号也省略掉则表示重复固定的次数。 例如,[0-9]{3} 匹配3位数字
  • (c|g|p)ar 匹配 car 或 gar 或 par
  • "(f|c|m)at\.?" => the fat cat sat on the mat.
  • "(t|t)he" => the car is parked in the garage.
  • "^(t|t)he" => the car is parked in the garage.

简写

简写 描述
\w 匹配所有字母数字,等同于 [a-za-z0-9_]
\w 匹配所有非字母数字,即符号,等同于: [^\w]
\d 匹配数字: [0-9]
\d 匹配非数字: [^\d]
\s 匹配所有空格字符,等同于: [\t\n\f\r\p{z}]
\s 匹配所有非空格字符: [^\s]
\f 匹配一个换页符
\n 匹配一个换行符
\r 匹配一个回车符
\t 匹配一个制表符
\v 匹配一个垂直制表符
\p 匹配 cr/lf(等同于 \r\n),用来匹配 dos 行终止符

模式修正符

标志 描述
i 忽略大小写。
g 全局搜索。
m 多行修饰符:锚点元字符 ^ $ 工作范围在每行的起始。
  • "/the/gi" => the fat cat sat on the mat.
  • "/.(at)/g" => the fat cat sat on the mat.
  • (^,$) 用于检查格式是否是在待检测字符串的开头或结尾。但我们如果想要它在每行的开头和结尾生效,我们需要用到多行修饰符 m。

贪婪匹配

正则表达式默认采用贪婪匹配模式,在该模式下意味着会匹配尽可能长的子串。

"/(.*at)/" => the fat cat sat on the mat.

惰性匹配

使用 ? 将贪婪匹配模式转化为惰性匹配模式。

"/(.*?at)/" => the fat cat sat on the mat.

断言

符号 描述
?= 正先行断言-存在
?! 负先行断言-排除
?<= 正后发断言-存在
?<! 负后发断言-排除
  • 定义一个正先行断言要使用 ()。在括号内部使用一个问号和等号: (?=...)。正先行断言的内容写在括号中的等号后面。 例如,表达式 (t|t)he(?=\sfat) 匹配 the 和 the,在括号中我们又定义了正先行断言 (?=\sfat) ,即 the 和 the 后面紧跟着 (空格)fat。
"(t|t)he(?=\sfat)" => the fat cat sat on the mat.
  • 负先行断言 ?! 用于筛选出其后不跟随断言中定义的格式。表达式 (t|t)he(?!\sfat) 匹配 the 和 the,且其后不跟着 (空格)fat。
"(t|t)he(?!\sfat)" => the fat cat sat on the mat.
  • 正后发断言 记作(?<=...) 用于筛选所有匹配结果,筛选条件为 其前跟随着断言中定义的格式。 例如,表达式 (?<=(t|t)he\s)(fat|mat) 匹配 fat 和 mat,且其前跟着 the 或 the。
"(?<=(t|t)he\s)(fat|mat)" => the fat cat sat on the mat.
  • 负后发断言 记作 (?<!...) 用于筛选所有匹配结果,筛选条件为 其前不跟随着断言中定义的格式。 例如,表达式 (?<!(t|t)he\s)(cat) 匹配 cat,且其前不跟着 the 或 the。
"(?<!(t|t)he\s)(cat)" => the cat sat on cat.

正则表达式的使用

判断字符串是否符合规则 test()

符合则返回true,否则返回false。

  var reg = /[^ab]/; // 规则:字符串中,除了a、b之外,还有没有其他的字符内容?
  var str = "acb";
 
  console.log(reg.test(str)); // 打印结果:true
	var reg = /[^0-9]/;  // 规则:字符串中,除了数字之外,还有没有其他的内容?
	var str1 = "1991";
	var str2 = "199a1";
 
	console.log(reg.test(str1)); // 打印结果:false (如果字符串是 纯数字,则返回 false)
	console.log(reg.test(str2)); // 打印结果:true

搜索第一个符合条件的字符串 search()

search()【只会查找第一个】——搜索字符串中是否含有指定内容。如果搜索到指定内容,则会返回第一次出现的索引;否则返回-1。

	var str = "hello abc hello aec afc";
	// 搜索字符串中是否含有abc 或 aec 或 afc
	result = str.search(/a[bef]c/);
	console.log(result); // 打印结果:6

搜索所有符合条件的字符串 match()

从一个字符串中将符合条件的内容提取出来,封装到一个数组中返回(即使只查询到一个结果)。

默认情况下,match()方法只会找到第一个符合要求的内容,设置正则表达式为全局匹配模式,这样就会匹配到所有的内容,并以数组的形式返回。

可以为一个正则表达式设置多个匹配模式,且匹配模式的顺序无所谓。

	var str = "1a2a3a4a5e6f7a8b9c";
 
	var result1 = str.match(/[a-z]/);   // 找到符合要求的第一个内容,然后返回
	var result2 = str.match(/[a-z]/g);  // 设置为“全局匹配”模式,匹配字符串中 所有的小写字母
	var result3 = str.match(/[a-z]/gi); // 设置多个匹配模式,匹配字符串中 所有的字母(忽略大小写)
 
	console.log(result1); // 打印结果:["a"]
	console.log(result2); // 打印结果:["a", "a", "a", "a", "e", "f"]
	console.log(result3); // 打印结果:["a", "a", "a", "a", "e", "f", "a", "b", "c"]

字符串拆分成数组 split()

	var str = "1a2b3c4d5e6f7g";
	var result = str.split(/[a-z]/); // 参数是一个正则表达式:表示所有字母
	console.log(result); //  ["1", "2", "3", "4", "5", "6", "7", ""]

 字符串替换 replace()

默认只会替换第一个,如果需要替换全部符合条件的内容,可以设置正则表达式为全局匹配模式。

let str1 = '2020/5/20'
console.log(str1.replace(/\//g,"-"));  //得到 2020-5-20
   
var str2 = "today is fine day,today is fine day !!!"
console.log(str2.replace("today","tomorrow"));  //只能替换第一个today
console.log(str2.replace(/today/gi,"tomorrow")); //这里用到了正则,且为“全局匹配”模式,才能替换所有的today

过滤html标签 

str.replace(/<.*?>/g, "") 

去除空格

	str = str.replace(/^\s*/, ""); //去除开头的空格
 
	str = str.replace(/\s*$/, ""); //去除结尾的空格

常用正则表达式

常用正则表达式大全

非零数字(只能输入数字,但值不能为0,可以是00,01等)

/^([0]{2}|0[1-9]|[1-9])\d*$/

验证保留两位小数的正整数或0

/^([1-9]\d*|0)(\.\d{1,2})?$/

验证手机号码,如13908653654

/^(1[3|5|7|8][0-9]{9})$/

验证固定号码,如010-86551122或01086551122

/^((0\d{2,3})[-]?)(\d{7,8})([-]?(\d{3,}))?$/

 验证电话号码—手机号码或固定号码,如13908653654或010-86551122或01086551122

/(^(1[3|5|7|8][0-9]{9})$)|(^((0\d{2,3})[-]?)(\d{7,8})([-]?(\d{3,}))?$)/

验证一代身份证号码

/^\d{8}(0\d|10|11|12)([0-2]\d|30|31)\d{3}$/

验证二代身份证号码

/^\d{6}(18|19|20)\d{2}(0\d|10|11|12)([0-2]\d|30|31)\d{3}[\dxx]$/

验证通用身份证号码

/(^\d{8}(0\d|10|11|12)([0-2]\d|30|31)\d{3}$)|(^\d{6}(18|19|20)\d{2}(0\d|10|11|12)([0-2]\d|30|31)\d{3}(\d|x|x)$)/

总结

到此这篇关于正则表达式regexp语法与用法的文章就介绍到这了,更多相关正则表达式regexp详解内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!

《正则表达式RegExp语法与用法详解.doc》

下载本文的Word格式文档,以方便收藏与打印。