正则表达式u修饰符(⽀持UTF-16编码)
正则表达式u修饰符:
此修饰符标识能够正确处理⼤于\uFFFF的Unicode字符。
也就是说,会正确处理四个字节的UTF-16编码。
此修饰符是ES2015新增,更多正则表达式新特性可以参阅ES2015 正则表达式新增特性⼀章节。
更多正则表达式教程可以参阅正则表达式教程板块。
代码实例:
console.log(/^\st("\uD842\uDFB7"))
unicode所有字符输出false,由于"\uD842\uDFB7"是⼀个四个字节的UTF-16编码,代表⼀个字符,所以如果正则表达式带有u修饰符,那么就能够识别它。
console.log(/^\uD842/.test("\uD842\uDFB7"))
输出true;不加u修饰符,那么就⽆法将四个字节的UTF-16编码识别为⼀个字符,所以就可以产⽣匹配。
/^.$/.test("\uD842\uDFB7")//false
/^.$/u.test("\uD842\uDFB7")//true
关于元字符点(.)的⽤法可以参阅正则表达式.号元字符⼀章节。
/^.$/.test("\uD842\uDFB7")//false
/^.$/u.test("\uD842\uDFB7")//true
添加u修饰符之后,点元字符就可以匹配码点⼤于0xFFFF的Unicode字符。
/ \u{61} /.test("a")//false
/ \u{61} / u.test("a")//true
使⽤u修饰符,正则表达式能够识别⼤括号{}表⽰的Unicode字符,否则⽆法识别,{61}也会被解读为量词,表⽰61个u字符。关于⼤括号表⽰的Unicode字符可以参阅ES2015 字符串新增特性⼀章节。