<p>BS中Comment对象中的数据,而Comment对象只是NavigableString的一种特殊类型,您需要做的是:</p>
<ol>
<li><p>找到包含信息的刺</p></li>
<li><p>使用BeautifulSoup将字符串转换为BS object</p></li>
<li><p>从BS object提取数据</p></li>
</ol>
<p><strong>代码:</strong></p>
<pre><code>import re
table_string = soup.find(string=re.compile('div_team_misc'))
</code></pre>
<p>这将返回包含表html代码的sting。在</p>
^{pr2}$
<p>使用sting构造BS对象,并从对象中提取数据</p>
<pre><code>for tr in table.find_all('tr', class_=False):
s = [td.string for td in tr('td')]
print(s)
</code></pre>
<p><strong>退出:</strong></p>
<pre><code>['17', '13', '2.17', '-0.51', '1.66', '106.9', '104.7', '96.5', '.300', '.319', '.493', '10.9', '20.5', '.228', '.501', '11.6', '79.6', '.148', 'Spectrum Center', '269,471']
['10', '9', '8', '24', '10', '17', '5', '15', '4', '11', '22', '1', '27', '5', '12', '28', '3', '1', None, '15']
</code></pre>
<p><strong>更多评论:</strong></p>
<pre><code>markup = "<b><! Hey, buddy. Want to buy a used parser? ></b>"
soup = BeautifulSoup(markup)
comment = soup.b.string
</code></pre>
<p>注释对象只是一种特殊类型的NavigableString,BS会从中提取字符串,我们不需要更改或替换任何html。在</p>
<pre><code>comment
# u'Hey, buddy. Want to buy a used parser'
</code></pre>
<p>基于此,我们可以使用纯BS而不是<code>re</code>来提取注释</p>
<pre><code>table_string = soup.find(id="all_team_misc").contents[-2]
</code></pre>
<p>如果要查找所有表字符串,可以执行以下操作:</p>
<pre><code>from bs4 import Commnet
tables = soup.find_all(string=lambda text:isinstance(text,Comment) and str(text).startswith(' \n'))
</code></pre>