table = soup.findAll('div', attrs={"class":"five columns"})
for data in table:
para = data.findAll('p')
print para
这就是我所剩下的
<p><span class="four">Location: </span> <span id="wt-loc" title="New Delhi / Safdarjung">New Delhi / Safdarjung</span></p>, <p><span class="four">Current Time: </span> <span id="wtct">Feb 12, 2017 at 10:29:52 am</span></p>, <p><span class="four">Latest Report: </span> Feb 12, 2017 at 8:30 am</p>, <p><span class="four">Visibility: </span> 1 km</p>, <p><span class="four">Pressure: </span> 102.12 kPa</p>, <p><span class="four">Humidity: </span> 95%</p>, <p><span class="four">Dew Point: </span> 10 °C</p>
您可以尝试使用BeautifulSoup对象
para.text
的.text
属性。我使用re.split()
函数进一步拆分了密钥对值,如果您不想拆分,那么只需执行para.text
输出:
使用
.text
获取p标记下的所有文本,您需要做的是迭代findAll(p)
输出:
Beautiful soup有一个名为get_text()的函数,允许您忽略其他标记获取标记中的所有文本。只要打电话
p.get_text()
。如果还想删除空白,请调用p.get_text(strip=True)
相关问题 更多 >
编程相关推荐