擅长:python、mysql、java
<p>首先,你的正则表达式为什么不起作用?在html中,属性用单引号引起来,而在正则表达式中则是双引号。你只需要关心href属性。尝试使用<code>href=['"](.+?)['"]</code>作为regex,如果使用ignore case开关会更好</p>
<p>但同样,使用regex解析html是一个非常糟糕的决定。请通过<a href="https://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags">this</a></p>