Python中文
首页
教程
问答
标签
搜索
登录
注册
使用Python Beautifulsoup进行抓取,获取href的url,该url是一个链接
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>使用Python/BeautifulSoup替换一些文档URL,我试图获得a href的实际链接。现在,href不是一个HTML链接,而是一个“嵌入”链接,如果我在浏览器中将鼠标悬停在它上面,它会给出实际的URL</p> <p>页面的“查看源”具有以下内容: <code><li class="toctree-l2"><a class="reference internal" href="accessanalyzer.html">AccessAnalyzer</a></li></code></p> <p>现在,以下代码确实起作用了,并为我提供了href字符串:</p> <pre><code>for i in soup.findAll('a', attrs={'class': 'reference internal'}): if "AccessAnalyzer" in i: print(i) link = i['href'] print(link) (output) <a class="reference internal" href="accessanalyzer.html">AccessAnalyzer</a> accessanalyzer.html </code></pre> <p>我试图获取的是accessanalyzer.html的实际URL,它是:</p> <pre><code>https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/accessanalyzer.html </code></pre> <p>当我将鼠标悬停在href上或单击它时,我将进入该URL</p> <p>如何获取URL? 还有,有一个包含嵌入链接而不是实际文本的href的概念的名称是什么?(这样我可以做更多的研究)</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>与<a href="https://stackoverflow.com/questions/51382162/getting-data-from-hidden-html-popup-using-bs4">what's described here.</a>类似,我相信您实际上需要某种webdriver自动机(Selenium等)来模拟悬停并获取数据</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
9 回答
如何添加表示整数的擦边字符串?
10 回答
如何添加要在Bokeh中使用的新font.ttf文件?
1 回答
如何添加要显示的矩阵XY轴编号和XY轴
2 回答
如何添加计数?
10 回答
如何添加计数器函数?
1 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
5 回答
如何添加计数器来跟踪while循环中的月份和年份?
6 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
1 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
5 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
8 回答
如何添加评论拉梅尔亚姆
5 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
9 回答
如何添加谷歌地点自动完成到Flask?
5 回答
如何添加超时、python discord bot
8 回答
如何添加超过1dp的检查
8 回答
如何添加距离方法
7 回答
如何添加跟随游戏的敌人精灵
8 回答
如何添加路径以便python可以找到程序?
6 回答
如何添加身份验证/安全性以使用happybase访问HBase?
8 回答