目前,我试图解析HTML文本以便只保存2到3个元素。 我的代码是这样的:
#!/usr/bin/env python
# coding: utf8
from bs4 import BeautifulSoup
html_doc = """
<div class="postcodedata">
<b>Latitude:</b> 51.19 degrees<br>
<b>Longitude:</b> 0.07 degrees<br>
<b>Postcode Town:</b> Tonbridge<br>
<b>Easting:</b> 545102 degrees<br>
<b>Northing:</b> 145533 degrees<br>
<b>Grid Ref:</b> TQ451455<br>
<b>District:</b> Sevenoaks<br>
<b>Ward:</b> Edenbridge South and West<br>
<b>Satnav:</b> TN8<br>
<b><a href="phonecodes/"><u>STD Phone Code</u></a>:</b>
(01959) xxxxxx
<div class="clear"></div>
</div>
"""
soup = BeautifulSoup(html_doc,'html.parser')
for hit in soup.findAll(attrs={'class' : 'postcodedata'}):
print hit.text
我想提取“城市邮政编码”、“卫星导航”和“标准电话代码”。在
我该如何处理这个提取?在
简单方法,只需添加如何管理数据:
希望帮助了你!在
我找到了一个解决方案:
相关问题 更多 >
编程相关推荐