<h2>以防万一</h2>
<p>为了避免两次循环,还可以使用BeautifulSoup css选择器和链<code>class</code>和<code><a></code>。因此,拿起你的汤,像这样选择:</p>
<pre><code>soup.select('.p-list-sec a')
</code></pre>
<p>要形成您想要处理的信息,您可以使用一个for循环或一个列表来理解<em>一行中的所有内容</em>:</p>
<pre><code>[{'url':link['href'], 'title':link['title']} for link in soup.select('.p-list-sec a')]
</code></pre>
<p><strong>输出</strong></p>
<pre><code>[{'url': 'link1', 'title': 'tltle1'},
{'url': 'link2', 'title': 'tltle2'},
{'url': 'link3', 'title': 'tltle3'},
{'url': 'link1', 'title': 'tltle1'},
{'url': 'link2', 'title': 'tltle2'},
{'url': 'link3', 'title': 'tltle3'},
{'url': 'link1', 'title': 'tltle1'},
{'url': 'link2', 'title': 'tltle2'},
{'url': 'link3', 'title': 'tltle3'}]
</code></pre>
<h2>要将其存储在csv中,请随意将其推入<code>pandas</code>或<code>csv</code></h2>
<p>熊猫:</p>
<pre><code>import pandas as pd
pd.DataFrame([{'url':link['href'], 'title':link['title']} for link in soup.select('.p-list-sec a')]).to_csv('url.csv', index=False)
</code></pre>
<p>CSV:</p>
<pre><code>import csv
data_list = [{'url':link['href'], 'title':link['title']} for link in soup.select('.p-list-sec a')]
keys = data_list[0].keys()
with open('url.csv', 'w') as output_file:
dict_writer = csv.DictWriter(output_file, keys)
dict_writer.writeheader()
dict_writer.writerows(data_list)
</code></pre>