擅长:python、mysql、java
<p>解析完html后:</p>
<pre><code>data = BeautifulSoup(h,"html.parser")
</code></pre>
<p>按以下方式查找标题:</p>
^{pr2}$
<p>{cd1>找到两个引号。有很多方法可以做到这一点。我会使用正则表达式:</p>
<pre><code>import re
match = re.search(r'".*"', title)
if match:
print match.group(0)
</code></pre>
<p>您永远不会搜索<code>&quot;</code>或任何其他<code>&NAME;</code>序列,因为beautifulGroup会将它们转换为它们表示的实际字符。在</p>
<p><strong>编辑:</strong></p>
<p>不捕获引号的Regex将是:</p>
<pre><code>re.search(r'(?<=").*(?=")', title)
</code></pre>