常⽤正则表达式—邮箱(Email)
常⽤正则表达式—邮箱(Email)
 本⽂针对有⼀点正则基础的同学,如果你对正则⼀⽆所知,请移步“
”学习。
要验证⼀个字符串是否为邮箱的话,⾸先要了解邮箱账号的格式。我尝试过在⽹上出⼀个标准的格式,但是很遗憾我没有到。我也尝试使⽤RFC标准来判断邮箱的格式,但是也没有结果。
虽然没有统⼀的邮箱账号格式,但是所有邮箱都符合“名称@域名”的规律。对于名称和域名的字符限制,我们可以根据项⽬的情况定义⼀个,⽐如只允许有英⽂、数字、下划线等组成。下⾯举例实现⼀些验证邮箱格式的正则表达式。
实例1、只允许英⽂字母、数字、下划线、英⽂句号、以及中划线组成
举例:kiki-9047@163
分析邮件名称部分:
26个⼤⼩写英⽂字母表⽰为a-zA-Z
数字表⽰为0-9
下划线表⽰为_
中划线表⽰为-
由于名称是由若⼲个字母、数字、下划线和中划线组成,所以需要⽤到+表⽰多次出现
 根据以上条件得出邮件名称表达式:[a-zA-Z0-9_-]+
分析域名部分:
⼀般域名的规律为“[N级域名][三级域名.]⼆级域名.顶级域名”,⽐如“qq”、“www.qq”、“mp.weixin.qq”、“12-34”,分析可得域名类似“** .** .** .**”组成。
“**”部分可以表⽰为[a-zA-Z0-9_-]+
“.**”部分可以表⽰为.[a-zA-Z0-9_-]+
多个“.**”可以表⽰为(.[a-zA-Z0-9_-]+)+
 综上所述,域名部分可以表⽰为[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+
最终表达式:
 由于邮箱的基本格式为“名称@域名”,需要使⽤“^”匹配邮箱的开始部分,⽤“KaTeX parse error: Can't use function '\.' in math mode at position 74: …[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)…
实例2、名称允许汉字、字母、数字,域名只允许英⽂域名
举例:刺⼼001Abc@lenovo
分析邮件名称部分:
汉字在正则表⽰为[\u4e00-\u9fa5]
字母和数字表⽰为A-Za-z0-9
 通过分析得出邮件名称部分表达式为[A-Za-z0-9\u4e00-\u9fa5]+
分析邮件域名部分
匹配邮箱的正则表达式
邮件部分可以参考实例1中的分析域名部分。
 得出域名部分的表达式为[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+。
最终表达式:
 我们⽤@符号将邮箱的名称和域名拼接起来,因此完整的邮箱表达式为
^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$