擅长:python、mysql、java
<p>由于表或标题都没有任何特征属性,所以可以使用<code>find_next_siblings</code>/<code>find_previous_siblings</code>方法来获取相邻的标记。在</p>
<pre><code>tables = soup.find_all('table')
data = []
for table in tables:
previous = table.find_previous_siblings('h2')
id = previous[0].get('id') if previous else None
rows = [td.get_text(strip=True) for td in table.find_all('td')]
data.append([id] + rows)
</code></pre>
<p><code>data</code>变量是一个嵌套列表,现在可以将其写入csv。在</p>
^{pr2}$