擅长:python、mysql、java
<p>如果您只解析链接,并且熟悉将要解析的内容,那么下面的正则表达式应该可以帮助您完成所要完成的任务,而且非常安全。你知道吗</p>
<pre><code>regex = re.compile(r'href="([^"]+)')
results = re.findall(regex, <CONTENT-HERE>)
</code></pre>
<ul>
<li><code>href="</code>消耗但不捕获文字字符<code>href="</code></li>
<li><code>([^"]+)</code>使用并捕获任何不是引号的字符</li>
</ul>
<p>对你正在抓取的内容进行一些试验,并评估你是否需要在regex中有更多的特异性。你知道吗</p>