擅长:python、mysql、java
<p>我认为子页面中<code>ul.list-unstyled</code>的选择范围太广了,其中有太多你实际上并不想要的内容。在</p>
<p>如果您真的只需要电话号码,可以直接搜索<code>a</code>标记,其中href以“tel:”开头。问题仍然是这些网站以这种方式列出多个数字,通常是2,其中一个是不可见的。可见的那个似乎总是在Nath下<code>div.col-md-3</code>。我试过了:</p>
<pre><code>def get_info(session,title,url):
r = session.get(url)
soup = BeautifulSoup(r.text,"lxml")
for a_phone in soup.select("div.col-md-3 a[href^='tel:']"):
print(title, a_phone.text)
</code></pre>
<p>得到如下结果:</p>
^{pr2}$