我正在学习pythonrequests
并美化组。为了练习,我选择编写一个快速的纽约市停车罚单解析器。我可以得到一个html响应,这是相当难看的。我需要抓起lineItemsTable
并解析所有的票。
你可以在这里复制页面:https://paydirect.link2gov.com/NYCParking-Plate/ItemSearch
并输入一个NY
板T630134C
soup = BeautifulSoup(plateRequest.text)
#print(soup.prettify())
#print soup.find_all('tr')
table = soup.find("table", { "class" : "lineItemsTable" })
for row in table.findAll("tr"):
cells = row.findAll("td")
print cells
有人能帮我吗?简单地查找所有的tr
并不能让我找到任何地方。
解决了,这就是您解析它们的html结果的方式:
下面是泛型
<table>
的工作示例。(问题链接断开)按GDP(国内生产总值)从here国家中提取该表。
函数
tableDataText
解析以标记<table>
开头的html段,后跟多个<tr>
(表行)和内部<td>
(表数据)标记。它返回包含内部列的行列表。在第一行中只接受一个<th>
(表头/数据)。使用它我们得到(前两行)。
它可以在
pandas.DataFrame
中轻松转换,以获得更高级的工具。给你:
这给了你:
有几点需要注意:
相关问题 更多 >
编程相关推荐