简单入门正则表达式

正则表达式

创建

创建方式

方式一:使用构造函数创建,语法为 new RegExp(正则表达式,匹配模式) ,该方法的特定是灵活,可以传递变量,但是使用累赘

const str = '1234 abcd'
let reg 

reg = new RegExp(/\d/, 'g')
console.log(str.match(reg))     // [ '1', '2', '3', '4' ]

const arg = '123'
reg = new RegExp(arg, 'g')
console.log(str.match(reg))     // [ '123' ]
复制代码

方式二:使用字面量创建,语法为 /正则表达式/匹配模式 ,该方法的特定是使用简单但是不灵活,无法传递变量

const str = '1234 abcd'
const reg = /\d/g

console.log(str.match(reg))     // [ '1', '2', '3', '4' ]
复制代码

使用构造函数的方式创建时,正则表达式为一个字符串格式,导致了使用 \ 符合需要额外转义 \\

const str = '1234 abcd'
const reg = new RegExp('\\d','g')

console.log(str.match(reg))       // [ '1', '2', '3', '4' ]
console.log(str.match(/\d/g))     // [ '1', '2', '3', '4' ]
复制代码

匹配模式

拥有 3 种匹配模式:

  • i:忽略大小写
  • g:全局匹配,默认匹配第一个满足条件项即退出,开启全局匹配则匹配全部
  • m:多行匹配,默认 ^$ 不会将换行符 \n 看做一段文本新的开头或结尾,开启多行匹配则看做新的一段文本
const str = 'abcd\nABCD'

console.log(str.match(/abcd/g))       // [ 'abcd' ]
console.log(str.match(/abcd/ig))      // [ 'abcd', 'ABCD' ]

console.log(str.match(/^abcd/ig))     // [ 'abcd' ]
console.log(str.match(/^abcd/igm))    // [ 'abcd', 'ABCD' ]
复制代码

匹配符号

单字符

匹配单个字符的特殊符号:

  • . :匹配一个任意字符
  • \.:匹配一个 . 字符
  • \\:匹配一个 \ 字符
  • \/:匹配一个 / 字符
  • \(:匹配一个 ( 字符
  • \):匹配一个 ) 字符
  • \d:匹配一个数字字符
  • \D:匹配一个非数字字符
  • \w:匹配一个字母、数字、下划线字符
  • \W:匹配一个字母、数字、下划线以外的字符
  • \s:匹配空格(空格符、Tab 符等)
  • \S:匹配非空格符
  • \b:匹配隐性边界
  • \B:匹配非隐性边界
const str = '123 abc .$\\/_'

console.log(str.match(/./g))    // [ '1', '2', '3',  ' ', 'a', 'b', 'c',  ' ', '.', '$', '\', '/', '_' ]
console.log(str.match(/\./g))   // [ '.' ]
console.log(str.match(/\\/g))   // [ '\' ]
console.log(str.match(/\//g))   // [ '/' ]
console.log(str.match(/\d/g))   // [ '1', '2', '3' ]
console.log(str.match(/\D/g))   // [ ' ', 'a',  'b', 'c', ' ',  '.', '$', '\', '/', '_' ]
console.log(str.match(/\w/g))   // [ '1', '2', '3', 'a', 'b', 'c', '_' ]
console.log(str.match(/\W/g))   // [ ' ', ' ', '.', '$', '\', '/' ]
console.log(str.match(/\s/g))   // [ ' ', ' ' ]
console.log(str.match(/\S/g))   // [ '1',  '2', '3', 'a', 'b',  'c', '.', '$', '\', '/', '_' ]
复制代码

单词和符号之间会产生一个隐性边界,单词指英文或数字字符,符号指中文及其他符号字符(如空格和特殊符号)

纯单词也会在首尾处产生隐性边界,而纯符号则不会

let str 

str = '123abc'
console.log(str.match(/\b/g))             // [ '', '' ]

str = '咯咯哒'
console.log(str.match(/\b/g))             // null

str = 'apple origin'
console.log(str.match(/\b/g))             // [ '', '', '', '' ]

// > 多个符号组合的情况
str = '咯咯哒 &*^% \\ + -'
console.log(str.match(/\b/g))             // null,纯符号不会产生边界

str = 'apple咯咯哒 &*^% \\ + -origin'
console.log(str.match(/\b/g))             // [ '', '', '', '' ],多个符号只影响一次隐性边界

// > 一般使用场景为匹配一个特定单词
str = 'gegeda gegedagegeda'
console.log(str.match(/\bgegeda\b/g))     // [ 'gegeda' ]
复制代码


位置

  • ^:匹配一行字符的开头
  • $:匹配一行字符的结尾
const str = '1221 1331'

console.log(str.match(/^1.../g))      // [ '1221' ]
console.log(str.match(/...1$/g))      // [ '1331' ]
复制代码

数量

  • *:匹配任意个字符(包括 0 个)
  • ?:匹配 0 个或 1 个字符
  • +:匹配至少 1 个字符
  • {n}:匹配正好出现 n 次的字符
  • {n, m}:匹配出现 n ~ m 次的字符
  • {n,}:匹配出现 n 次及以上的字符
reg = /a*bc/          // 匹配bc或任意个a后跟bc
reg = /a?bc/          // 匹配bc或abc
reg = /a+bc/          // 匹配abc或一个以上a后跟bc
reg = /a{3}bc/        // 匹配aaabc
reg = /(ab){3}c/      // 匹配abababc
reg = /a{1,3}bc/      // 匹配abc或abbc或abbbc
reg = /a{3,}bc/       // 匹配3个及3个以上a后跟bc
复制代码

  • | :表示或关系
  • []:表示或关系
    • [n-m]:匹配 n-m 范围内的任意字符
      • [a-z]:匹配任意一个小写字母
      • [A-Z]:匹配任意一个大写字母
      • [A-z]:匹配任意一个字母
      • [0-9]:匹配任意一个数字
    • [^x]:匹配任意一个非 x 的字符

|[] 用法稍有区别,| 可以用来匹配多个字符的或,而 [] 用来匹配单个字符的或

reg = /a|b/				// 匹配a或b
reg = /[ab]/			// 匹配a或b
reg = /a|bc|d/		// 匹配a或bc或d
reg = /a[bc]d/		// 匹配abd或acd
reg = /^[0-9]/		// 匹配任意一个非数字字符
复制代码

[] 表达式中,所有特殊符号均不需要转义

const str = '.\\/()'

console.log(str.match(/[.\/()]/g))    // [ '.', '/', '(', ')' ]
复制代码

特殊用法

贪婪/惰性匹配

  • 贪婪匹配:.*,匹配到整个字符串的末尾

  • 惰性匹配:.*?:匹配到最近的一个满足项

const str = '"data: aaa" "data: bbb"'
let reg

reg = /"data:.*"/g
console.log(str.match(reg))       // [ '"data: aaa" "data: bbb"' ],匹配到末尾的"

reg = /"data:.*?"/g
console.log(str.match(reg))       // [ '"data: aaa"', '"data: bbb"' ],只匹配到下一个"
复制代码

先行/后行断言

  • 正向先行断言:(?=str):匹配字符串的一个位置,该位置之后紧邻的字符为 str

  • 正向后行断言:(?<=str):匹配字符串的一个位置,该位置之前紧邻的字符为 str

  • 负向先行断言:(?!str):匹配字符串的一个位置,该位置之后紧邻的字符不能为 str

  • 负向后行断言:(?<!str):匹配字符串的一个位置,该位置之前紧邻的字符不能为 str

先/后行断言匹配的是一个位置,而非一个字符,如果匹配需要包含 str,则需要另外匹配 str 语法

const str = 'a1bc a2bc a3bc a4bc'
let reg

reg = /a(?=1).../g
console.log(str.match(reg))     // [ 'a1bc' ]

reg = /..(?<=2)b./g
console.log(str.match(reg))     // [ 'a2bc' ]

reg = /a(?!1).../g
console.log(str.match(reg))     // [ 'a2bc', 'a3bc', 'a4bc' ]

reg = /..(?<!2)b./g
console.log(str.match(reg))     // [ 'a1bc', 'a3bc', 'a4bc' ]
复制代码

正则方法

regexp.exec (str)

  • 功能:获取正则匹配信息
  • 参数:
    • str: string:被检验字符串
  • 返回值:Array<any> | null,一个检验信息数组,如果匹配不到则返回 null
const str = 'abcd 1234'
const reg = /^a../g

console.log(reg.exec(str))        // [ 'abc', index: 0, input: 'abcd 1234', groups: undefined ]
复制代码

regexp.test (str)

  • 功能:检验字符串是否满足正则匹配
  • 参数:
    • str: string:被检验字符串
  • 返回值:boolean,检验结果
const str = 'abcd 1234'
const reg = /^a../g

console.log(reg.test(str))        // true
复制代码
© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享