Python中文
首页
教程
问答
标签
搜索
登录
注册
使用beauthoulsoup通过文本获取Href
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我用“requests”和“beautifulsoup”来搜索一个网页中包含特定文本的所有href链接。我已经做了,但是如果文本换行,beauthoulsoup不会“看到”它,也不会返回链接。在</p> <pre><code>soup = BeautifulSoup(webpageAdress, "lxml") path = soup.findAll('a', href=True, text="Something3") print(path) </code></pre> <p>示例:</p> <p>像这样,它返回Something3文本的Href:</p> ^{2}$ <p>像这样,它不会返回Something3文本的Href:</p> <pre><code>... <a href="page1/somethingC.aspx"> Something3</a> ... </code></pre> <p>不同的是,Href text(Something3)在新行中。 我不能更改HTML代码,因为我不是那个网页的网站管理员。在</p> <p>你知道我该怎么解决吗?在</p> <p>注意:我已经试过使用汤。更换('\n','').replace('\r',''),但我得到错误NoneType'对象不可调用。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>以及一个没有正则表达式的解决方案:</p> <pre><code>path = soup.select('a') if path[0].getText().strip() == 'Something3': print(path) </code></pre> <p>输出:</p> ^{pr2}$
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在乒乓球比赛中预测球的轨迹,对于AI球拍预测?
9 回答
如何在乒乓球游戏中阻止球
9 回答
如何在乘法和模中不乘空间?
10 回答
如何在乘法和除以2个不同的数字之间进行交换?
1 回答
如何在也是数据一部分的单个字符上拆分大字符串
5 回答
如何在乾草堆中找到針,有更好的解決方案嗎?
4 回答
如何在事件wxWidgets中传递自定义数据
10 回答
如何在事件中使用lambda i=i?
2 回答
如何在事件中心只接收最近的数据
10 回答
如何在事件发生之前保持云函数运行?
6 回答
如何在事件发生后使页面重定向到同一页面
9 回答
如何在事件回调之间保持python生成器的状态
8 回答
如何在事件处理程序(pythonsocket、sphinx)中保留docstring
9 回答
如何在事件处理程序中更改wxRichTextCtrl的光标位置?
6 回答
如何在事件处理程序中访问外部对象?
3 回答
如何在事件循环中将协程打包为正常函数?
9 回答
如何在事件循环之外运行协同程序?
6 回答
如何在事件循环结束时为并发未来的所有线程调用类方法?
6 回答
如何在事件文件中只保留一份摘要?
5 回答
如何在事件模板中添加事件
3 回答