正则表达式获取a便签内的href链接举例(a标签内容是可变
的)
pattern = repile(r'<a\b[^>]+\bhref="([^"]*)"[^>]*>' + str(link_text) + '.*?</a>')
result = pattern.search(html)
# up(1))
result_url = up(1)      #页⾯内的链接
<a\b #匹配a标签的开始
[^>]+ #匹配a标签中href之前的内容
\bhref="([^"]*)" #匹配href的值,并将匹配内容捕获到分组1当中
[^>]*> #匹配a标签中href之后的内容
' + str(link_text) +    :正则表达式匹配可变字符串
href标签怎么用
</a> #匹配a标签的结束