如何在数据绑定之间刮取文本?

2024-09-30 01:37:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图在html代码中刮取名称

<h3><a data-bind="'attr': { 'href': PersonURL }, 'text': PersonName" 
    href="/bios/mbaxter">Michael N. Baxter</a></h3>

我的密码如下

^{pr2}$

名称似乎位于类“data bind”中。我怎样才能确保我能擦掉这个名字?在


Tags: 代码text名称databindhtmlh3attr
1条回答
网友
1楼 · 发布于 2024-09-30 01:37:16

那个网站的内容非常动态。因此,您有两个选择:要么使用任何浏览器模拟器,如selenium,要么使用包含json数据的正确url。后者无疑是最好的办法。在

这就是你可以抓住它们的方法(简单的方法):

import requests

url = "https://www.morganlewis.com/biosearchnew/execute?pagenum=1&isInternalBioRequest=false&SortingField=Last%20name&currentGroup=36ef4ad43dea406895fa2d41af32fada&loadCategories=true&param_sitecontentcategory=OUR%20PEOPLE&pagesize=500&schoolsearchstring=villanova&personofficeitem_sm=36ef4ad43dea406895fa2d41af32fada"

res = requests.get(url)
for items in res.json()['SearchResults']:
    print(items['Title'])

部分响应:

^{pr2}$

相关问题 更多 >

    热门问题