Python BeautifulSoup返回的网页与我的不同

url=https://infoweb.newsbank.com/apps/news/results?sort=YMD_date%3AD&p=AWNB&t=&maxresults=20&f=advanced&b=results&val-base-0=January%201%2C%202005&fld-base-0=YMD_date&bln-base-1=and&val-base-1=drone%2C%20unmanned%20aerial%20vehicle%2C%20UAV&fld-base-1=alltext page = requests.get(url, allow_redirects=True) allcont = BeautifulSoup(page.text, 'html.parser') allcont.find_all('div',class_="search-hits__meta--total_hits")

1条回答

网友

1楼 · 发布于 2024-09-27 21:23:21

您提供的URL将为任何外部访问者加载用户登录页。所以BeautifulSoup（BS）也会给你该页面的html。要获得登录后找到的搜索结果，需要首先登录到该页面，然后在该页面中使用BS解析器。但是BS不支持登录。相反，可以使用selenium实现浏览器自动化，通过selenium执行登录，还可以获得登录页面的html。请参阅selenium中的get\u attribute（）。你知道吗

编程相关推荐

JavaSpringBootHibernate5忽略@Table和@Column
java readLine是如何工作的？
java除了Oracle的JVM（windows）之外，还有什么BSD许可的替代方案吗？
javascript处理程序执行导致异常：所需的MultipartFile参数“file”不存在
java如何检查url是否与标识符匹配？
java在对象创建之后实现一个接口
java安卓：如何将github库放入项目中
java如何制作自定义文本组件？
如何在java中更新属性文件
java Hibernate持久映射

相关问题更多 >

编程相关推荐

热门问题

热门文章